中国政府は国策事業として自動運転車産業を育成、シリコンバレーのBaidu研究所が開発拠点になる

April 27th, 2016

中国で自動運転車開発が未曽有の勢いで進んでいる。開催中の北京自動車ショーで相次いで自動運転車がデビューした。AIで世界のトップを走るBaiduは自動運転車技術開発拠点をシリコンバレーに設立した。中国政府は自動運転車のロードマップを開発し、標準化や法令整備を推進する。中国が官民一体で先行している日米欧を激しく追っている。

vwb_629_car_baidu (p01)

北京自動車ショーでの自動運転車出典

中国の自動車ショー「Beijing International Automotive Exhibition」が北京で開催されている。米国メディアは中国インターネット企業が自動車産業に進出していることを大きく報道している。特に、中国ハイテク企業が自動運転車を開発していることに危機感を抱いている。

これら出展企業はニュースリリースなどで自動運転技術を世界にアピールしている。中国大手自動車メーカー「Changan Automobile (長安汽車)」は会場に自動運転車を展示した (上の写真)。自動運転車は「Changan Raeton」を改造したもので、車体のクローム塗装が光を反射してキラキラ輝いている。これに先立ち、Changanは2016年3月、インターネット最大手のBaidu (百度) と提携し、自動運転車を開発することを発表した。Baiduが開発している自動運転技術を導入することを意味する。また、自動車ショーの直前には、Changanは自動運転車の長距離走行試験を実施した。4月12日、二台の自動運転車でChanganの拠点Chongqing (重慶) を出発し、Xi‘an (西安) などを経て4月17日にBeijing (北京) に到達した。全長2000キロを自動運転で走行し、技術力の高さを示した。

vwb_629_car_baidu (p02)

オンラインビデオ配信企業「LeEco」は会場に自動運転車コンセプトカー「LeSEE」 (上の写真) を展示している。LeEcoは自動車ショーに先立ちこれを発表し、LeSEEのコンセプトビデオを公開した。このビデオによると、LeSEEは等高線を模したデザインが基本コンセプトで、未来のモビリティーを提供する。LeSEEはEVでスマホや車載タブレットで操作する。LeSEEは完全自動運転車で、ステアリングはダッシュボードに格納される。ステアリングを取り出すとマニュアルでドライブができる。まだ試験走行は実施されていないが、IT企業が自動運転車事業に参入したことで話題となっている。

中国政府の自動車政策

中国企業が自動運転車を相次いで投入する理由は中国政府の新しい産業政策にある。中国は自動運転技術では他国に後れを取っているが、中国政府は自動運転車産業を育成する方向に大きく舵を切った。米国の主要メディアなどが伝えている。中国政府は自動運転技術に関するロードマップを2016年内に発表する。これによると、ハイウェー向けの自動運転車は2021年までに、市街地向けの自動運転車は2025年までに出荷される計画だ。ロードマップでは自動運転車の標準化や法令指針を定める。中国政府が自動運転車開発のためのフレームワークを定めることになる。

ロードマップはTechnical Standard (技術標準化) として、クルマの通信方式、インフラ、法令に関する指針を定める。自動運転車の通信手段としては携帯電話ネットワークを利用する。インフラについては言及されていないが、V2VやV2I通信で自動運転車の走行を周囲の環境が支えるものと思われる。法令整備では中国全土で自動運転車が走行できるための指針を定める。ロードマップは自動運転車に関するテクノロジー、社会インフラ、関連法規を包括的にカバーする。

中国政府が自動運転車産業を育成する背景には、経済成長鈍化に対する危機感がある。中国政府は重工業や製造業中心の産業をハイテク産業にシフトさせる。この中心を担うのがEVや自動運転車となる。産業構造改革が喫緊の課題で、中国政府がハイテク産業移行の道筋をつける。また、北京を中心とする交通渋滞を自動運転車で解消する狙いもある。人間よりも効率的に走行でき、限られた道路を有効に利用できる。更に、増え続ける交通事故を減少させる狙いもある。

Baiduがシリコンバレーで自動運転車開発

中国の自動運転技術を支えるのがBaiduとなる。Baiduは中国最大手の検索サービス会社であるが、最近ではAI技術で世界のトップを走っている。Baiduは2016年4月、シリコンバレーに自動運転車チーム「Self-Driving Car Team」を設立することを発表した。このチームはBaiduの自動運転部門「Autonomous Driving Unit (ADU)」の一部として位置づけられる。

チームの目的は自動運転技術の開発と試験で、2016年末までに100人規模の体制とする。研究領域は、機械学習、ロボティックス、コンピュータビジョン、オンボードコンピュータ、センサーなど。自動車業界から経験豊富な人材を招へいする計画も明らかにしている。このチームは、自動運転技術の中でもPlanning (機械学習でルートを算出)、Perception (周囲のオブジェクトを把握)、Control (クルマの制御) の分野を中心に研究開発を進める。チームはシリコンバレーに拠点を置く研究部門「Baidu Research」 (下の写真) と密接に開発を進める。

vwb_629_car_baidu (p03)

Baiduの自動運転車投入計画

これに先立ちBaiduは2015年12月、自動運転車を開発し2018年までに中国市場に投入することを公表した。Baidu副社長Wang JingがWall Street Journalのインタビューで明らかにした。WangによるとBaiduは既に自動運転車の走行試験を実施している。試験車両はBMW 3-Series Gran Turismoを改造したもので (下の写真)、二台で北京市北部の幹線道路などで試験を繰り返している。Baiduは政府機関と共同で公共の交通機関を提供することを計画している。自動運転車は決められたルートや特定地域を走行するシャトルサービス (Public Shuttle) として提供される。クルマは普通車やバンを使い、自動運転シャトルがループを運行し、徐々に運行範囲を拡大していく。

vwb_629_car_baidu (p04)

Andrew Ngが自動運転車技術開発を後押し

自動運転車開発を推進しているのがBaidu Research所長Andrew Ng (下の写真) である。Ngは、Baiduの自動運転車を米国で展開する計画を明らかにした。NgはBaiduのシリコンバレーの人材を活用し、米国政府と協調する必要性を明らかにした。Baiduがシリコンバレーで自動運転車を開発することを決定した背景にはNgの存在がある。

Ngはスタンフォード大学でDeep Learningの研究に従事し、この分野で基礎研究をリードしてきた。その後Googleに移籍し、人間の頭脳を模したプロジェクト「Google Brain」を立ち上げた。大規模な並列計算環境でDeep Learningを稼働させ、システムがハイレベルな概念 (例えばネコ) を学習できることを実証した。現在はBaidu Research所長で同社のAI研究開発を主導する。Ngが本格的に技術開発を進めることで、Baiduの自動運転事業が大きく前進する。

vwb_629_car_baidu (p05)

無人自動運転車の開発は無理

Ngは自動運転車のあり方についての見解を明らかにしている。注目すべきは、Ngは無人自動運転車の開発は現実的でないとの見方を示している点だ。現在の技術レベルでは人間のように振る舞う無人自動運転車の開発は不可能で、クルマは社会インフラと協調する必要があるとしている。この仕組みはメーカー一社でできることではなく、コミュニティーとして取り組む必要があるとも述べている。

この理由としてNgは自動運転車の課題を挙げている。例えば、道路作業員は工事現場で手信号でクルマを誘導する。しかし、自動運転車は手の動きの意味を理解することができない。AI技術が急速に進化しているが、当面は自動運転車が人間のように運転できるわけではない。道路などの社会インフラに少し手を加えることで、自動運転車をサポートする必要性を主張する。道路作業員はビーコンやアプリを使い、手信号の意味を自動運転車に伝える。自動運転車は緊急自動車のサイレンやライトの点滅の意味を理解できないので、緊急自動車が自動運転車に非常事態を連絡する方法の確立が必要としている。AI研究の第一人者が無人自動運転車開発は難しいと述べるのことは重い意味を持つ。Googleが苦戦しているように、ハードルの高さを再認識する結果となった。

自動運転車の挙動を予測できる仕組み

Ngは自動運転車の危険性を認識し、その対策が必要であるとも主張する。自動運転車は頻繁にブレーキをかけるなど、人間とは異なる特異な挙動をする。交通の流れに沿って走れるよう改良されているが、それでも人間の運転とは異なるので、自動運転車は一目でわかるデザインとすべきと主張する。このため、Baiduの自動運転車はお洒落なデザインではなく、上部が白色で下部が赤色と目立つ外観となっている。

シリコンバレーでGoogle自動運転車と並走するとこの意味がよく分かる。先日、Googleプロトタイプの三台後ろを走り、車線が二車線から一車線に減る区間に差し掛かった。我々は時速35マイル程度で走っていたが、プロトタイプが低速で合流してきた。みんなが一斉にブレーキを踏む結果となった。プロトタイプは車両特性から最高速度が時速25マイルに制限されているため、違法な運転をしているわけではない。自動運転車の挙動は人間とは大きく異なることを再認識する出来事であった。プロトタイプの事故の殆どが後続車による追突で、何らかの対策が必要であると実感する。今後、自動運転車試験車両が世界各地を走ることになり、抜本的な対策が必要になる。(下の写真はGoogleプロトタイプで、ドアには市民がデザインした街の風景がペイントされている。Google自動運転車は市民生活に溶け込むことを目指している。)

vwb_629_car_baidu (p06)

米国は中国企業に危機感を抱く

米国メディアが中国企業の自動運転車を克明に報道するのは理由がある。米国では規制や道路法規の面で自動運転車開発にとって厳しい状況が続いている。公聴会でカリフォルニア州政府とGoogleやUberなど開発企業の意見を聞くと、両者の間に深い溝を感じる。共同で新技術を育成するという雰囲気はなく、お互いの立場を主張するだけで平行線が続く。また、連邦政府と州政府の方針も異なり、社会インフラが整うまで時間がかかりそうだ。

これに対し中国は政府が先頭に立ち新産業を育成をする。中国の自動運転車技術は二年遅れているといわれるが、このままでは米中が逆転するのではないかと、多くの人が危機感を抱いている。中国の追い上げが米国にとっての黒船になり、政府と民間企業が協調して自動運転車インフラを整備する切っ掛けになることを期待している。

Google自動運転車が初めて交通事故を起こす、AIが人間の危険な運転テクニックを学習したため

April 21st, 2016

Google自動運転車が路線バスと接触事故を起こしたことは全米のメディアで大きく取り上げられた。AIが間違いを犯し、自動運転車への信頼感が揺らいだ。Googleは事故原因の詳細を公表し、過失の一部は自動運転車の判断ミスに起因すると結論付けた。しかし、自動運転車と並走する機会が増えるにつれ、問題の本質が見えてきた。Google自動運転車は法規通りに走るのではなく、人間の危険な運転テクニックを学び始めた。

vwb_628_car_google_accident (p01)

自動運転技術についての説明

Googleの自動運転車責任者Chris Urmsonは、2016年3月、Austin (テキサス州) で開催されたカンファレンスSouth by Southwest (SXSW) で自動運転技術開発状況を説明した。講演の模様はYouTubeで公開された。Urmsonは自動運転車開発の経緯とメカニズムを中心に説明した。更に、自動運転車が事故を起こした原因と、製品出荷予定時期についても言及した。これらは初めて開示される情報で、自動運転技術開発の難しさを改めて認識することとなった。

事故原因はアルゴリズムの判断ミス

事故は2016年2月、Mountain View (カリフォルニア州) の幹線道路で起こった。Google自動運転車「Lexusモデル」が路線バスと低速度で接触した。事故の原因はGoogle自動運転車の仮定と路線バスの運転手の仮定が異なったために発生した。自動運転車は 交差点で右折するため、信号待ちで停車しているクルマの右側をすり抜けて進んだ。(下の写真、緑色の帯で示されいる部分、桃色の箱は自動車を示す。) しかし、路上右側に砂袋二つがあり、クルマはその上を走れないと判断し、その前で停止した (下の写真、黄色ストップサイン)。

vwb_628_car_google_accident (p02)

信号が青になり、Google自動運転車は後ろから路線バスが近づいているのを認識した。自動運転車はバスが減速し道を譲ってくれるとの仮定の下、二つの砂袋を避けるため左にハンドルを切った。バスはそのまま直進し自動運転車と接触した。クルマの速度は時速2マイル (時速3キロ) で、運転手や乗客に被害が及ぶことはなかった。

Urmsonは自動運転車の試験を開始してから初めての事故で大変残念な結果だと述べた。Googleは既に3500件の試験プログラムを実行し、同じ事故が二度と起きないようアルゴリズムを修正したとも述べた。

事故の本質はAIの教育方法

これがGoogleの公式見解であるが、事故が起こった原因はAIをどう教育するかという本質的な問題を含んでいる。Google自動運転車がMountain View市街地で走行試験を進めるにつれ並走する機会が増えた。自動運転車は安全に走行し、一緒に走って不安は感じない。ただ、安全サイドにプログラムされていると感じる場面が多々ある。例えば、自動運転車は交差点の一時停止標識で止まり、左右の安全を確認して発進するが、かなり余裕を持って動き出す。人間だと発進するタイミングだが自動運転車は発進しなので、すこしイライラすることもある。筆者だけでなく、多くのドライバーが同じ思いで、自動運転車に対し不満が募っていた。

このため2015年後半から、Googleはアルゴリズムを改良し、自動運転車が他のドライバーの流れに沿って走れるようにした。今までは厳格に道路交通法を守ってきたが、これからは人間のドライバーのように、状況に応じて柔軟に判断する。今までは、右折の際はレーンにとどまり信号が青に変わるのを待っていたが、新しいアルゴリズムではクルマの右端をすり抜けて前に出る。また、追い越し禁止の場所でも、安全を確認して車線を跨いで停車しているクルマを交わして走る。人間のように柔軟な運転ができるようになった。

Google自動運運転車の”キャラクター”設定

これが裏目に出て今回の事故に結び付いた。Google自動運転車は道路交通法を厳格に守るスタイルから、人間のドライバーのように柔軟に運転するテクニックを覚えた。厳格すぎると交通渋滞を引き起こし住民から苦情を受けるが、柔軟すぎると今回のような事故につながる。どのスタイルでGoogle自動運転車を教育するのか、さじ加減が難しい。

別の言葉で表現すると、Google自動運運転車の”キャラクター”設定が課題になる。ハイヤーの運転手さんのように安全でスムーズなスタイルにするのか、また、宅配便のドライバーのように小気味良い走りにするのか、マンマシンインターフェイスが問われている。軽快な走りになるほど安全性の確保が難しく、高度な自動運転技術が要求される。

下の写真は事故現場で、信号待ちでクルマが込み合う。多くのドライバーは停車しているクルマと路肩の間のスペースを走って右折する。道路交通法によるとこの行為はグレーゾーンであるが、この交差点での取り締まりは実施されていない。Google自動運転車はこの運転テクニックを覚え事故を起こした。

vwb_628_car_google_accident (p03)

出荷時期には幅がある

Urmasonは自動運転車の出荷時期につて、初めてGoogleの公式見解を示した。Urmsonは出荷時期を「3年後から30年後」と述べ、幅を持たせた発表となった。この意味は、最初のモデルは三年後の2019年に出荷され、最終モデルは30年後になるということを示す。つまり、Googleは自動運転車を「段階的にリリースする」計画であることが分かった。クルマにとって優しい環境から製品を投入し、順次、難しい環境に拡大していくことになる。

ここでいう環境とは道路と天候を指す。道路の観点からは、自動運転車にとってハイウェーや幹線道路の運転は比較的容易だが、市街地中心部分が一番難しい。道路両端にクルマが駐車し、歩行者や自転車など異なるモードのトラフィックがある。天候の観点からは、自動運転車は晴れが続く環境では走りやすいが、雪や小雨が降る地域は走りにくい。雪が積もって路面が見えない場所や、雨上がりで路面が濡れ鏡のように光を反射する場所も走りにくい。

地域別にリリースされる

Urmsonは具体的な場所については言及しなかったが、自動運転車の最初のモデルは都市郊外で天候のいい地域に投入されることになる。いまテスト走行を繰り返している、Mountain View (カリフォルニア州) やAustin (テキサス州) を中心とする地域となる可能性が高い。この地域で実績を積むと、次は難度の高いところに製品を投入する。例えば年間を通じて雨が多いKirkland (ワシントン州) などが候補になる。事実、GoogleはKirklandで自動運転車の走行試験を始めた。Google自動運転車は、初期の携帯電話と同じように、使える地域が限定されることになる。

これ以上の説明はなかったが、中国・北京やインドネシア・ジャカルタの交通渋滞に対応するためには、Google自動運転車の開発には時間を要す。また、パキスタン・カラチのように、クルマとバイクと歩行者が入り乱れ、交通ルールが守られない地域 (下の写真) では、そもそも自動運転車は走れるのかとの疑問の声も聞かれる。

vwb_628_car_google_accident (p04)

自動運転技術開発の難しさ

Googleは無人で走行する自動運転車を目指しており、自動車メーカーより格段に難しいルートを走っている。Urmsonの説明を聞くと、当初は走行できる地域がかなり限定されることが分かってきた。三年後にはGoogle自動運転車が全米を駆け巡る勢いであったが、ここにきてトーンダウンした感は否めない。自動運転車の製品化が近づくにつれ、より現実的な姿が示された。同時に、AIで世界のトップを走るGoogleが保守的な見解を述べることは、自動運転技術開発の難しさを改めて示す結果となった。

Facebookが会話ボットを投入、人工知能と対話して買い物する「会話コマース」がビジネスを一変する

April 14th, 2016

Microsoftに続きFacebookが会話ボットを投入した。Facebookの会話ボットは優秀な店員のように振る舞い、消費者と対話しながら商品を販売する。こんなに便利な仕組みがあれば、ウェブサイトでの買い物から足が遠のく。次の産業崩壊はウェブショッピングなのか、ビジネスが大きく変わろうとしている。

vwb_627_ai_facebook_chatbot (p01)

Facebookが会話ボットを投入

Facebookは2016年4月、San Franciscoで開催された開発者向け会議「F8」で会話ボット (Bots) を発表した (上の写真)。会議の模様はストリーミングで中継された。会話ボットはメッセージングサービス「Messenger」で稼働し、Facebookはこれを「Bots on Messenger」と呼んでいる。企業やブランドはMessenger上で会話ボットを使ってビジネスを展開する。会話ボットが人間のように振る舞い、顧客サポート、ショッピング支援、ニュース配信などを手掛ける。

会話ボットでフラワーアレンジメントを購入

投入された会話ボットを使って実際に商品を購入してみた。Messengerで会話ボットを起動し、対話しながらのショッピングは快適だった。街の小売店で店員さんに案内されながら買い物をしているようで心地よかった。実際に使った会話ボットは花屋さん「1-800-Flowers.com」で、フラワーアレンジメントを注文した (下の写真)。会話ボットの指示に従って進み、好みの商品を見つけ、クレジットカードで会計した。初期画面で「Oder flowers」ボタンを選択し (下の写真左側)、メッセージに従って、商品配送先住所を入力した (下の写真中央)。更に、商品の配送日を指定した。

vwb_627_ai_facebook_chatbot (p02)

会話ボットは商品サンプルをカテゴリーごとに表示し、ここから希望の商品を選択した。「Roses」というカテゴリーを選択するとバラのフラワーアレンジメントが表示され、この中から「Julep Cup Petite Bouquet」という商品を選択した (上の写真右側)。

親近感を感じる

更に会話ボットの質問に対し、フラワーアレンジメントに沿えるメッセージやメールアドレスなどを入力した。料金はクレジットカードで支払うが、この処理はMessengerを離れ、決済クラウド「Stripe」で実施された。StripeのウインドウがMessenger上にオーバーレイされ、必要情報を入力し決済処理が行われた。注文したフラワーアレンジメントは二時間後に配送され(下の写真)、会話ボットでの買い物はあっけないほど順調に終了した。

会話ボットを使ったショッピングは、アプリを使う方法に比べて便利と感じた。会話ボットと対話しながらショッピングが進むのは、店舗で店員さんと話しながら買い物をしているようで、親近感を感じた。アプリでのショッピングは機械的であるが、会話ボットはどこか親しみを感じた。人間は他人とコミュニケーションすることを求めているのか、相手が会話ボットであっても、しっくりするものを感じた。

vwb_627_ai_facebook_chatbot (p03)

Messenger Platformで会話ボット開発

Facebookは会話ボットを開発する基盤として「Messenger Platform」をリリースした。企業やブランドはこの基盤で会話ボットを開発する。会話ボット自体の開発では専用API「Send / Receive API」を組み込みメッセージを送受信する。「Structured Templates」とよばれるフォームを使うことで、メッセージにUIを組み込む。上述のフラワーアレンジメントで表示されたボックス、選択ボタン、写真などで使われている。

Facebookは会話ボットを使ってマーケッティングする仕組みも提供している。企業のウェブサイトに「Messenger Code」を表示し、消費者がこのコードをスキャンすると、会話ボットにリンクする。下の写真はCNNの事例で、画面中央のコード (ロゴの周りの青色の線) をMessengerでスキャンするとCNN会話ボットにリンクする。この他に、ウェブサイトやアプリに「Message Me」ボタンを表示し、これををクリックすると会話ボットにリンクする。消費者が簡単に会話ボットを見つける仕組みが提供されている。

vwb_627_ai_facebook_chatbot (p04)

インテリジェントな会話ボット

会話ボットはMessenger Platformで開発されるが、Facebookは会話ボットのAI機能「Bot Engine」を公開した。Bot Engineは機械学習機能や複雑な会話機能を組み込むために使われる。Bot Engineには「Wit.ai」というAI技術が使われている。Wit.aiは自然言語解析エンジンで利用者の言葉を理解する。

Facebookは2015年1月Wit.aiを買収し、自社の会話ボット「Facebook M」にこの技術を組み込んでいる。Bot Engineの機械学習機能を使い、会話ボットにデータを読み込ませて教育する。会話ボットはデータから学習を続けインテリジェントになる。下の写真右側は会話ボット「Movie Bot」の事例で、利用者が映画「Zootopia」のチケットを購入している様子。会話ボットは多彩な表現を理解でき、消費者は会話しながらチケットを購入する。Wit.aiに消費者が話す多彩な表現を定義しておく (下の写真左側)。

vwb_627_ai_facebook_chatbot (p05)

多くの企業が会話ボットを投入

既に多くの企業がMessengerで会話ボットを投入することを表明している。銀行では「Bank of America」が会話ボットを運用する。消費者に対して会話ボットがアラートを発行することが計画されている。旅行サイト「Expedia」は会話ボットがホテルや飛行機の予約購入を受け付ける。このほかに、映画チケットサイト「Fandango」、IT企業「HP」、カフェ「Philz Coffee」、レストラン「Burger King」が会話ボットの開発を進めている。

Messengerがアプリを置き換える

Messenger利用者数は9億人で、その数は急速に増えている。9億人が会話ボットの潜在顧客となり、FacebookはMessengerをコマース・プラットフォームと位置づけ、便利に買い物ができる仕組みを構築した。Messengerが好まれる理由は、トランザクションを実行する際に、アプリを使うよりはるかに便利なためである。今までは異なる商品を購買するためには、異なるアプリを起動し、IDとパスワードでログインしてきた。しかし、Messengerでは同じ場所で航空券や洋服やフラワーアレンジメントを購入できるため、使い勝手が格段に向上する。このため、ショッピングではMessengerがアプリを置き換えるといわれている。

vwb_627_ai_facebook_chatbot (p06)

Conversational Commerce (会話コマース)

会話ボットで買い物をするスタイルはFacebook Mが示している (上の写真)。AIを搭載したFacebook Mはヒトのように振る舞い、利用者は自然な会話で目的を完遂する。出産のお祝いを探しているときは、Mに対して「出産祝いを探しているが、おもちゃは十分ある」と語り掛ければ、Mは「靴はどうですか」とズバリ回答を示す (上の写真左側)。シカゴに出張するときに、お勧めのレストランを訪ねるとMは「Command Burgerが人気がある」と教えてくれる (上の写真右側)。

Amazonで好みの商品を探すより、はるかに簡便に目的を達成できる。商品の購入や情報検索はウェブサイトからメッセージングに移ることをFacebook Mが示唆している。つまり、我々の生活空間はメッセージング基盤に構築され、これに伴いビジネスもここで展開される。消費者と会話を通じた取引は「Conversational Commerce (会話コマース)」と呼ばれている。現在のElectronic Commerce (Eコマース) からパラダイムシフトが始まった。

Cortanaはインテリジェントな秘書に進化、Microsoftが描く会話ボットと生活する社会

April 8th, 2016

Microsoftは会話ボットのロードマップを明らかにした。Cortanaがインテリジェントな仮想秘書となりSkype Chatで稼働する。Cortanaが人間の秘書のようにスケジュールを管理する。離れた場所で会議が入ると、Cortanaがホテルの会話ボットに連絡を取り部屋を予約する。会話ボットが活躍する時代となり、いまより格段に便利な社会が訪れようとしている。

vwb_626_ai_microsoft_cortana (p01)

Cortanaのロードマップ

Microsoftは開発者向けのカンファレンス「Build」で会話ボットについて包括的な戦略を明らかにした (上の写真、Satya Nadalの基調講演)。Microsoftは会話ボットを開発するプラットフォーム「Bot Framework」を投入し、大企業から小企業までが会話ボットを開発できる環境が整った。

同時に、MicrosoftはCortanaのロードマップを示した。CortanaはWindows Phoneの仮想秘書「Personal Assistant」として登場し、今では、Windows 10などで使われている。これからは、CortanaはSkype Chatを通して利用者と交信する会話ボットに進化する。Skype Chatはメッセージングプラットフォームとして機能し、Cortanaが人間の秘書のように振る舞い、利用者とチャットで会話する。更に、Cortanaは外部の会話ボットと交信する。つまり、Cortanaは会話ボットを統括するメタアプリとして位置づけられる。Cortanaが他の会話ボットを指揮下に置き、これらを使ってスケジュール管理などのタスクを実行する。Cortanaも会話ボットの一つであるが、一段高いところから一般の会話ボットを統括する。

Cortanaは気の利く秘書

Buildのステージで、MicrosoftはCortanaが人間の秘書に代わりスケジュールを管理するデモを実演した。Cortanaはインテリジェントなアシスタントとして使われているが、今回はそれをもう一歩進め、会話機能を強化し、利用者と会話しながらタスクを実行する機能を実装した。Skype ChatでCortanaと会話しながスケジュールを管理できる。具体的には、会議の予定を入れるため、Skype ChatでCortanaへ、「4月10日から12日までの期間、○○○というイベントをカレンダーに追加」とテキストメッセージを送信する。Cortanaはこれに従って、Outlookカレンダーにこのイベントを追加する。

以前に交わしたチャットから、Cortanaはイベントが開催される場所はアイルランド・ダブリンで、利用者はWestin Hotelがお気に入りであることを把握している。このため、CortanaはダブリンのWestin Hotelを予約しましょうかと申し出る。(下の写真はSkype ChatでCortanaと会話している様子。左側上段にホテル情報を示し、中段はCortanaがホテル予約を申し出ているところ。)

vwb_626_ai_microsoft_cortana (p02)

ホテル会話ボット話しながら部屋を予約

利用者がYesと回答すると、CortanaはWestin Hotelが運営する会話ボット「Westin Hotel Bot」にコンタクトし、利用者の宿泊予定を連絡する。このようにホテルは既に会話ボットの運用を始めており、チャットしながら予約を受け付ける。ここではWestin Hotel Botが利用者と会話しながら予約作業を進めていく (上の写真左側、下段)。

Westin Hotel Botは利用者に「4/10から4/12の期間宿泊ですか?」と確認のメッセージを送信する (上の写真中央、中段)。利用者がYesと答えると、Westin Hotel Botは部屋のタイプを表示する (上の写真中央、下段)。希望のタイプを選択すると予約が完了する (上の写真右側、上段)。更に、Cortanaは利用者の友人がダブリンにいることを把握しており、話してみますかと提案する (上の写真右側、下段)。Cortanaは気の利いた秘書のように振る舞い、会議の予定をカレンダーに追加するよう指示するだけで、ホテルの予約まで完了する。

Skype Chatがプラットフォームになる

上述の通り、会話ボットとの対話はSkype Chatで進行する。Skypeはビデオ会議ツールとして幅広く利用されているが、Microsoftはこれをメッセージングプラットフォームとして再定義する。Skypeのチャット機能であるSkype Chatがプラットフォームとして位置づけられる。Skype ChatがWeChatやLineに相当し、ここで旅行を計画し、買い物をし、会話ボットと交信する。Skype Chatはもはやチャットツールではなく、基本ソフトのような存在に昇格し、会話ボットを支えるプラットフォームとして機能する。

仮想アシスタントの競争が激化

AI技術の中でいま一番ホットな分野がこの仮想アシスタントの分野だ。Facebookは既に仮想アシスタント「Facebook M」を発表した。Mはメッセージングサービス「Messenger」の中心機能として位置づけられ、タスクを実行するエージェントとして動作する。Mは利用者の言葉を理解し、指示に従って、買い物などを実行する。現在Mの実証実験が行われており、本格稼働も近いとみられている。

Googleも会話ボットを開発中と噂されている。会話ボットはGoogleのメッセージングプラットフォーム「Hangouts」で稼働するともいわれる。ただ、Hangoutsの人気は芳しくなく、Googleは大幅な改造を進めている。Googleは三社の中でやや出遅れている感はあるが、コアコンピテンシーであるAI技術を駆使し、斬新な会話ボットが登場すると期待されている。

MicrosoftのAI戦略、インテリジェントな会話ボットがアプリを置き換える

April 1st, 2016

Microsoftは会話ボット「Tay」を米国市場に投入したが、一日でサービスを中止することとなった。Microsoftは自社で会話ボットを投入するだけでなく、企業が会話ボットを開発できるフレームワークを明らかにした。会話ボットがヒトとの接点となり、複雑なタスクを実行する。Microsoftは会話ボットが仮想秘書となり、アプリの時代は終わりに向かうとみている。

vwb_625_ai_microsoft_chatbot (p01)

Conversation as a Platform

Microsoft CEOのSatya Nadalは開発者向けのカンファレンス「Build」でAI戦略について明らかにした。その中心は会話ボットで、利用者とインテリジェントに対話する技術が示された。Microsoftは会話ボットがビジネスの中核を担うとの認識を示し、これを開発するプラットフォームを提供する。この技術は「Conversation as a Platform」と呼ばれ、人間と対話する技術を開発する基盤となる。Microsoftが自社で会話ボットを開発するだけでなく、大企業から小企業までが会話ボットで事業を展開できる環境が提供された。

AIがインターフェイスになる

Nadalは言葉がコンピューターのインターフェイスになるという見解を示した。MicrosoftはAIに代表されるインテリジェンスをコンピュータ技術に融合する。会話インターフェイスは三つの主要技術であるAzure、Office、Windowsに導入される。これがGUIやウェブデザインやモバイルデバイスのタッチインターフェイスを決定的に変えることになる。AIを教育して人間の言葉や会話の仕方を学習させ、幅広いコンテクストや利用者の嗜好を教える。AIが利用者の日常のタスクを手助けする存在となるとしている。

Personal AssistantsとBots

Nadalは会話ボットを「Personal Assistants」と「Bots」に分けて説明した。「Personal Assistants」は仮想秘書で、利用者の情報を把握し毎日の生活でタスク遂行を援助する。これを支えるのが会話技術で、ヒトとリッチな会話できることを目指している。既に会話技術はSkype Translateで使われ、話し言葉を相手の言語にリアルタイムで翻訳する。

これに対してBotsは新しい形式のアプリケーションで仮想ロボットとしてタスクを実行する。これからは複数のアプリを立ち上げたり、ウェブを閲覧するのではく、Botsと会話して目的のタスクを実行する。Botsはヒトと会話するだけでなく、Botが別のBotと会話する。更に、BotsがPersonal Assistantsとも会話する。

これらを纏めると、人間の言語が新しいインターフェイスとなる。Botsが新世代のアプリで、Personal Assistantsはメタアプリとして位置づけられる。具体的には、CortanaがPersonal AssistantでTayがBotという関係となる。インテリジェンスは人間との接点に埋め込まれる。

メッセージングプラットフォームの台頭

これら会話ボットは急成長しているメッセージングプラットフォームで使われる。メッセージングプラットフォームとはWeChatやLineやSlackなどを指す。これらはテキストメッセージを送受信するだけでなく、今ではここで本を購入し、Uberを呼び、お金を送ることができる。今ではメッセージングプラットフォームが生活空間となる。メッセージングプラットフォームはアプリというより、基本ソフトに近い存在になった。MicrosoftのメッセージングプラットフォームはSkypeで、ここで会話ボットを展開する。同時に、上述の人気メッセージングプラットフォームでも会話ボットを展開する。

Microsoft Bot Framework

Microsoftは企業がBotsを開発できる環境を提供する。これは「Bot Framework」と呼ばれ、開発者はこのフレームワークを使ってBotに会話機能を組み込む。Bot Frameworkはオープンソースとして公開され、だれでも自由に利用できる。既にBotを展開している企業は、このフレームワークで人気メッセージングプラットフォームにBotsを展開できる。Botsを持っていない企業は「Microsoft Bot Builder SDK 」を使ってBotを開発する。MicrosoftはこのフレームワークをGitHubに公開しておりでだれでも自由に利用できる。更に、自然言語解析機能や機械学習機能も公開されており、Botを開発できる環境が整った。

会話ボットのストアー

Microsoftは「Bot Directory」を開発中であることを明らかにした。これはBotストアーで、ここに様々なBotが登録される。これはアプリストアーに匹敵し、ここで好みのBotを見つけて利用する。カンファレンスではBotのサンプルが紹介された (下の写真)。「BuildBot」はBuildカンファレンス向けBotで、参加者に会場案内などの機能を提供する。アプリに代わりBotsが会話しながらインテリジェントに利用者をナビゲーションする。

vwb_625_ai_microsoft_chatbot (p02)

ピザ注文を受け付けるBot

更に、ピザ注文を受け付けるBotが紹介された。これは「PizzaBot」という名称で、人間に代わりピザの注文を処理する。PizzaBotは利用者との対話を通してピザの種類などを把握し注文を受け付ける。PizzaBotは話された言葉から、ピザの種類、配送先住所を把握し、登録しているクレジットカードで決済する。PizzaBotは大手ピザレストランDominoが開発したもので、同社のSecure APIを使ってトランザクションを実行する。PizzaBotはBot Directoryに登録され、SkypeやSlackなど主要なメッセージングプラットフォームで利用できる。Bot Frameworkはオープンなフレームワークでメッセージングのエコシステム拡大を目指す。

vwb_625_ai_microsoft_chatbot (p03)

Bot Intelligence

PizzaBotが顧客と対話するためには、話し言葉を認識する必要がある。この自然言語解析機能は「Bot Intelligence」として提供される。その中心がルールベースの自然言語解析機能「Rule-based Natural Language Understanding」である。これがPizzaBotの背後で稼働し、入力された言葉を理解する。これは話された言葉のなかで何が指定されているのかを把握する。具体的には、ピザの「宅配」、「数量」、「大きさ」、「トッピング」のクラスに対応する言語を抽出し、オーダーの内容を理解する。

Bot Intelligenceは辞書「Semantic Dictionary」を持ち、ピザの注文で使われる言葉が定義される。ここには「Deliver」という動詞が登録され、この他に「Order」や「Buy」が同義語であると定義されている。Botがこれらの単語を認識すると、ピザが発注されたと理解する。ピザを注文する言葉は数が多くBot Intelligenceにはこのほかに、「Bring」、「Get」、「Purchase」などが登録されている。

機械学習ツール

このようにルールを設定していくが、販売量が増え規模が大きくなると、Bot Intelligenceの管理運営が難しくなる。このため、機械学習ツール「Machine Learning based Natural Language Understanding」が提供される。機械学習ツールはDeep Learningで会話を学習する。下の写真は解析結果で、入力された文章と文章の理解度を示している。最初の文章は確度が0.573と低く、Botは内容を十分に把握できていない。このため管理者はBotを教育していく。具体的には、文章を分解し単語の属性を付加する。Botは「My Crib」の意味が分からないので、開発者はこれは「自宅」という意味で、「Location」に区分されると教える (下の写真)。Botは学習を通じて賢くなっていく。

vwb_625_ai_microsoft_chatbot (p04)

中国のアイディアを借用

Botをメッセージングプラットフォームで展開するというアイディアはMicrosoftが生み出したものではなく、中国で展開されているWeChatのアイディアを借用したものだ。米国企業が中国で人気のサービスをコピーした形となった。Nadalは冒頭で、中国の80歳の女性がWeChatでショッピングを楽しんでいる事例を紹介した。この女性は、スマートフォンで、ウェブサイトを閲覧したりアプリを使うことができない。しかし、この女性はWeChatで会話を楽しみ、買い物ができるようになったと述べた。人間は会話するのが一番自然であることを端的に示している。

アプリを会話ボットで置き換える

今まではアプリを立ち上げて、小さなキーボードで必要事項を入力していた。これからは、Botに音声で注文すると処理が完了する。足らない情報があれば、Botが質問するので、それに言葉で回答する。店員さんに注文している感覚で、自然なインターフェイスで処理が進む。上述の事例以外にも、大手ホテルチェーンWestin Hotelは、Bot Frameworkを使ってBotを開発した。利用者は話し言葉でホテルを予約できる。若い世代だけでなくシニア層でもBotを使う人が増えると期待される。

Nadalは会話ボットがアプリを置き換えるとの認識を示した。この背後にはMicrosoftがモバイルで出遅れていることがある。iOSやAndroidで数多くのアプリが稼働し、巨大な経済圏を形成している。これに対抗するのはアプリではなく、会話ボットであるとの戦略をとっている。Microsoftが最初にこの市場に参入したのはこのような理由による。MicrosoftはAIに向けて大きく舵を切った形となった。