アイキャッチ

「ペイするAIの社会実装」に向け、今欠かせない議論とは。豊田啓介が提起するイシューと大阪・関西万博2025

ITニュース

スマホからリアルへ、モノのインターネット、さらには街、空間へという流れは今後一層加速していくと見られている。それに伴い、今論点になっているのはどんなことで、考え方をどう改める必要があるのか。こうした前提を知っておくことは、エンジニアがこれからのキャリアを考える上でも有益なのではないか。

そこで今回は『BIT VALLEY 2021』の中から、東京大学生産技術研究所特任教授・豊田啓介さんによる講演「モノと情報、インタースペース」を取り上げる。

スマートシティを専門分野とする建築家の豊田さんは、実効的なAIの社会実装にはまだ考えなければならない課題が山積みであり、自身が招致に関わった「2025年日本国際博覧会/ EXPO 2025 Osaka, Kansai, Japan」(以下「大阪・関西万博」)は、そのための重要な実験場になり得ると主張する。

タイトルにもある「インタースペース」、そしてそのベースとなる概念「モノと情報が重なる共有領域=コモングラウンド」とは何か、なぜそれが重要なのかを紐解くところから講演は始まった。

プロフィール画像

東京大学生産技術研究所、noiz、gluon、建築情報学会 特任教授
豊田 啓介さん(@toyoda_noiz

ザインを用いた建築や内装設計を設計事務所noizで主導しつつ、スマートシティコンサルティングのgluonでデジタルツイン領域の新しい概念「コモングラウンド」を主導。2025年に開催される大阪・関西万博の誘致会場計画などに次世代のスマートシティの概念を導入。「コモングラウンド」およびその拡張概念の「インタースペース」の研究拠点として、21年に東京大学生産技術研究所にインタースペース連携研究センターを開設。産官学連携での汎用デジタル空間記述の体系構築を進めている

モノと情報が重なる共有領域=コモングラウンド

「コモングラウンド」という言葉は、必ずしもわれわれがオリジナルで使っているものではありません。

会話情報学と呼ばれる領域では、異なる二人(例えばロボットと人間、人工知能と人間など)の間で会話や共通認識を生成するには、直接的に言葉が表す意味などだけではなく、どうやらその背後にあるボヤッとした概念のようなものまで共有できていないといけない、とされています。

こうした考え方が、モノとか形、都市といった世界においても非常に重要なのではないかということで、コモングラウンドという言葉を拝借しているかたちです。

豊田さん

例えば上の図では、左右の軸がフィジカルかデジタルか、上下は環境かエージェントかを示しています。環境かエージェントかというのは、入れ物の箱かその中の点かと考えていただければいいです。

20世紀までは、「フィジカル / エージェント」(人やモノや動物など)が行為者かつ受益者としてあり、それに対して「フィジカル / 環境」(都市や建築や自然)があるという、大雑把に言えばこの二項対立の中で世界が成立していました。

しかし21世紀になり、特にコロナ禍のような状況も後押しして、オフィスにARのアバターがいるとか、モビリティーがコーヒーを運んできてくれるといったことが、突然現実になりつつあります。

ここでは「デジタル / エージェント」、もしくは「Non-Human Agent」という言い方をしていますが、人以外の自律的な行為主体がわれわれの日常に入ってきているということです。

彼らが物理世界(例えば机やドアなど)を認識して、それをどう避けるかということをリアルに考えないと、都市計画や建築ができなくなってきています。

けれども、皆さんもよくご存知のように、自律走行のエージェントやロボットにとって、物理世界を認識することはまだ非常にハードルが高いです。

そのため、例えばSALM化するとか、ARクラウドに置いておくなどといったかたちで、いわゆる「デジタルツイン」と言われるような環境(「デジタル / 環境」)を作り、それを疑似的に読むことで、リアルな「フィジカル / 環境」を読むのとほぼ等価であるという状況を作り出しています。

現状はそれを各業態ごと、企業ごと、サービスごとにやっているのですが、サービスの数が今後も増え続ければ、その間のAPIの連携などはとんでもないことになってしまいます。

であれば、みんなが使うような環境の記述とか、必要なLOD(Level of Detail)の設定のようなものは、あらかじめ環境の側に置いておけばいいのではないか。そうすれば、みんなはそれを読むだけで済むし、相互連携もしやすくなるだろうというのが、コモングラウンドという言葉の大きな考え方になります。

重要さを増す人間「外」の視点

「Non-Human Agent」と一括りにしているものの中にも、完全なフィジカルとバーチャル、完全な自律と他律(アバター)の間にスペクトルがあります。さらに、デジタルにおいては環境自体も自律エージェントになり得ます。

このあたりはまだ体系化されていない領域なので、まずはそれを体系化していくこと。その上でコモングラウンド=共有領域はどこにあるのか、何を作っておけば一石二鳥、三鳥、十鳥になるのかを今、東大生産研で考えているところです。

豊田さん

ここでポイントになるのは「Non-Human Agent」、要は人間以外の視点です。

例えば、これまでの建物の評価というのは、人にとっていかに使いやすいか、居心地が良いかが唯一の基準でした。しかしこれからは、Non-Human Agentにとっていかに動きやすいか、いかに認識しやすいかといったことが意外なほど重要になっていきます。

むしろそういう人間「外」の視点を持つことが、人間にとっての総合的な幸せや生きやすさにもつながっていくのではないかということです。

これは社会的な動きともパラレルです。

例えばジェンダーのような話も、男か女かという二項対立だったところから、その間に非常に繊細で多様なグラデーションがあるというふうに、社会の概念として急速に今、変わってきています。これが人間の世界の男女間だけでなく、その外側にも拡張していくのではないかと。

半分だけ人間が乗り移っているロボットや、人間が背後にいるアバター、あるいは自律的なロボットなどにとっても、いかに動きやすい環境になっているか。要は、彼らにも人権のようなものを認めてあげる視点が、社会の多様性や選択肢を広げていく上で、非常に大事になってきていると思うのです。

豊田さん

点から面、そしてインター「スペース」へ

建築や都市を本業とするわれわれにとっては、物理世界と情報世界をできるだけ多くの人が理解できるかたちでつなぐことがクリティカルなアジェンダになります。

コモングラウンドというのは、概念としては非常に大きなものですが、一方で狭義には、人間が認識できるスケールで物理世界と情報世界をつなぐ(3D記述する)方法と言い換えることができます。

物理世界と情報世界の連携の体系(モノの3D記述の方法)には、コモングラウンド以外にも、さまざまなものがあります。われわれはそれら一つ一つの特徴をすべて踏まえた上で体系化、相互連携の地図を書くことにも取り組んでおり、そのすべてをまとめたものを「インタースペース」と呼んでいます。

モノと情報の接続というと、例えばIoTのようなものがバズワードとして出てきますが、こうしたものは接続「点」でしかありません。空間的には0次元ですし、情報(例えば温度や湿度など)というスカラー量を認めたとしても、1次元ということにしかなりません。

現状の建築や都市は、こうした接続「点」が非常に疎な状態にあります。例えば人体などと比べても、建築や都市が持っているセンシングポイントは非常に少ないです。このような状態では、都市や建築にスマートな身体性を持たせるのは到底無理。より高次元でハイモダリティーな接続性が必要でしょう。

そこで今主流になっているのが、現在皆さんが見ている画面のようなインター「フェース」です。実際には動画であったり音声であったりもするので、字義通り2次元ではないですが、情報空間と物理空間の接面は限られています。

理想的にはやはり、空間そのものがインターフェースになった状態、つまりインター「スペース」です。広域の情報とモノのインタラクションを高次元で行える環境が今、求められているのです。

豊田さん

都市の空間記述に最適なのはゲームエンジン?

では、その中での住み分けや専門性をどう体系化して、実装への道筋を作っていくのか。これが大きな課題になってきています。

インタースペースを考える時に重要なのは空間のスケール、そしてそれ以上に時間のスケールです。

デジタルツイン、ミラーワールドなど今はさまざまな言葉が出回っていて、「とりあえずモノを3次元・デジタル形式で記述すればそれでいいじゃないか」という十把一絡げの議論になりがちです。

しかし、実際にはその中にも本当にいろいろな種類があります。特性はバラバラですし、互換性の問題もあります。ですから、まずはこれらを空間、時間のスケールを軸に体系立てて理解する必要があります。

豊田さん

例えば、地理的な位置を利用した空間記述にはGIS(Geographic Information System)と呼ばれる体系があります。今話題の「PLATEAU」には「CityGML」、皆さんよくご存知のGoogle Earthには「KML」というGISの一種の体系が用いられています。

このようにGISの中にもいくつかのファミリーがあり、それぞれに異なる特徴がありますが、ざっくり言えば、すごく大きなスケールを静的データとして記述し、上から見た時にサクサク動くようにするのがGISの大きな特徴です。

BIM(Building Information Modeling)は、建築に使われる3Dデータ。GISと比べてもう少し細かく、ミリやサブミリ単位まで扱えますが、建設目的に特化しているため、環境記述としての能力は低いです。板や窓枠などの構造材単位で記述してしまうので、ロボットがBIMを読みながら環境を動くことはなかなかできません。

POINT CLOUD(点群)は、非常にいろいろなデータがリアルタイムで取れますが、属性記述や階層的な記述、セグメンテーションが非常に難しいので、これはこれで環境を汎用に記述するのは難しい。

……と見ていくと、図のグレーのハッチに入っているような時間、空間スケールの記述に適した3D記述形式としては、ゲームの世界でよく使われる、いわゆるゲームエンジンが使えるのではないかと考えられます。

ゲームエンジンは、このスケールの領域で、マルチエージェントを常に相手して、その間の相互調整もできる前提で、何百万人が使ってもバグらずに、レイテンシも人間の気にならず、嘘つくところはすごくうまく嘘をついて、実効的に回し続けるところに特化しているシステムです。

いろいろなプレーヤーがいる中で、空間を実効的に記述しようとした時に持たなければいけない性質をものすごく多く持っている。これは実際の都市や建築の記述に使えるのではないか、というのが大きな考え方になります。

「ペイするAI実装」までの5段階

豊田さん

「Interspace1.0」と表現しましたが、まず第1段階として整理したいと思っているのは、一つには、先ほどから申し上げているように、空間/時間スケールの違うさまざまな体系がどう連携しうるのか。そして、それを踏まえて各体系をどうファインチューンしていったらいいのか、です。

例えば、ゲームエンジンが適していると言っても、今のところはまだバーチャル空間に特化していて、実空間との連携をするのは苦手です。ゲームエンジンをどう進化させ、どういう機能を持たせていったら実空間のメディエーターとして実効性を持つようになるのか、といったことを考える必要があります。

二つ目に、実空間の中でのエージェントの空間測位のような話があります。室内での測位の技術にはいろいろありますし、室外になるとGNSSやGPSがベースになります。

よく「ラストワンマイル」と言われてるような、デリバリーの荷物が車からベッドサイドまで行く間に、測位の体系が二つか、下手をすると三つか四つ違ってくるということです。これではサービス実装ができませんから、特に室内外の測位技術のシームレス化をしないといけません。

そして三つ目に、静的か動的か。BIMやGISは静的な連絡形式だし、一方でゲームエンジンはより動的な指向性を持っている。その間の違いと相互連携、もしくは変換の可能性ももっと体系化しなくてはいけない。

こういったことができてくると、ここでは「Interspace2.0」と書いていますが、空間の方が能動性、自律性を持ち始めます。

あらかじめ空間側にみんなが使うものを置いておくことで、それに接続すればいいという社会的コストの低減になるだけではなく、例えば「今ドアを開けると外側の人にぶつかるから、0.5秒待ちなさい」とか「君は左に、君は右に避けなさい」というように、空間側がより能動的に管制できるようになります。

逆に言えばそれができないと、朝の品川駅のようなところにいろいろなサービスが充填された状態を制御できないことになります。

この「Interspace2.0」と言われている状態がある程度体系化されない限りは、AIのようなものが試験実装を超えて社会実装できる状態は来ない。そのための状況を作りたいというのが大きなテーマです。

今は、都市や建築にAIで何かを実装したいと思っていろいろ試してみても、なかなか難しいところがあります。なぜなら、現実にはあるはずの粒度の揃ったデータが取れないから。これは皆さんも実感することが多いのではないでしょうか。

しかし、4の段階ができると、あらゆる行為がインタースペースというフィルターを通じてデータ化されているということになりますから、とにかくデータが取れる状態になります。しかもそれは粒度が揃っているし、編集も可能です。

そうならない限りは、本当に社会的に実効性がある、「ペイをするAI実装」のようなものはなかなか実現できないのではと考えています。

豊田さん

期間限定の実験都市としての万博

そういったものを実装していく上で、モノと情報が複合的に、高次に接続するインターサーフェスとしての都市の可能性は、これまでに比べて劇的に高まっていると思います。そういう意味で、次世代型スマートシティのようなものは今後も投資領域として非常な価値を持っていくでしょう。

しかし、非常にパラドクシカルなことに、スマートシティを実験するためには、スマートシティ実装の仮説の実験都市が必要という難しい状況になります。まずは小さく始めて、徐々に徐々にスケールアップをしながら、もしくは複合度のレイヤーをアップしながら最終的な社会実装につなげていくという、段階的かつ戦略的な実装プロセスを誰かが、もしくはみんなで描いていく必要があります。

その際には、単にデジタライズするだけ、あるいはデジタライズしたものを人間の目に見やすいようにビジュアライズするだけではなく、いろいろなNon-Human Agentにとって理解がしやすい記述体系を把握した上で、そのうちのどこが実効的なのかを判断し、多様な双方向性をいかに担保していくかが重要になります。

頓挫してしまいましたがGoogleのSidewalk Labs、Alibabaのシティブレイン、Tensentが深センに作っている、おそらくはゲームエンジンとして都市を記述する世界最初のスマートシティ、もしくはBIMで記述しているシンガポール……こうした世界の先行するスマートシティは、それぞれデータや記述方式、目的、時間的な対応性といったものがまったく違うと見ています。

豊田さん

このあたりをしっかりと整理した上で、どこに効果を見て、何を目指すのかという戦略をいかに体系的に持つかが、われわれに求められることではないでしょうか。

そこで万博です。僕はたまたま、大阪・関西万博の招致に際して、会場計画のディレクションを任されていました。正直に言って、最初は万博なんてオワコンだと思っていたのですが、先ほど触れたようなニーズがあることを考えると、見方が変わってきます。

国と民間のコンセンサスを取り、何千億円も投資をして、住民のコンフリクトなく、好きなものを建てて、死ぬほど実験してみんなでデータを取りまくり、半年後に後腐れなく全部解体してしまう。そんな実験のための都市を作れる枠組みなど、世界中を見渡してもおそらくは万博しかありません。

それが2025年というタイミングで来るのはすごいことではないかと思い直し、今では積極的に関わっています。

「Extended」と「Enhanced」、二つの方向性

その際に大事なのは、物理的な会場を作るだけでもないし、バーチャルな会場を作るだけでもない。その二つをいかにつなぐかです。

コモングラウンド、もしくはより広義にインタースペースでもいいのですが、それがどういう構造、どういう体系を持っていて、どんなデータをどう扱えばいいのか、運用する組織にはどんなスペシャリストが必要なのかといったことはすべて、現時点ではまだ分かりませんから、それらを明らかにする必要があります。

そのために万博というものを一つのフラグとして立てて、そこに向けて一部でもいいから実装体制を作る。そうやって実装したノウハウとデータを本格的な都市、社会基盤実装につなげていく機会はもう、これを逃したらないと思います。

当然ですが、これは一社独占ではできないし、やっても社会的な意味をなしません。共創領域として作り、いかにオープン化していくかが問われています。

これまででいくと(あるいは今なおそうかもしれないですが)、われわれの発想はどうしても「万博会場」といった物理的な制約にとらわれてしまいます。現実に今回の万博も、会場のゲートを通った人間の数がKPIとして設定され、2830万人という目標値が置かれています。

ですが、例えば先日Epic Gamesが主催したTravis Scottのオンラインコンサートは、2日間の開催中に、今回の万博の目標値とほぼ同数の2800万人がバーチャル会場を訪れています。ああいったものもまたKPIになるはずであり、むしろ万博を半年間開催すれば、280億人といった規模で人が集まってもおかしくないわけです。

豊田さん

その中にはアバターで来場する人も2億8000万人くらいいるかもしれないと考えると、ここには「Extended Experience」と書いていますが、身体的、物理的には会場を訪れなくても、部分的に体験ができる、貢献ができる、エクスチェンジができるといったことは、桁違いに外側に広がっていくでしょう。

逆に、身体的、物理的にその場所を訪れた人に関しては、「Enhanced Experience」と書きましたが、さまざまなバーチャルなアシストを受けることで、よりインパクトの強い、拡張・増幅体験もできるようになるでしょう。

「バーチャルとリアルの複合」と言うとどうしても十把一絡げにされがちですが、この「Extended」の方向性と「Enhanced」の方向性は明確に分けて、それぞれのナローダウンした価値化や、実装に向けた試金石としての実証実験の扱いを戦略的に整理していくことが、万博の使い方としておそらく相当大事になります。

万博を旗頭にみんなで新たな産業を作ろう

万博に関しては、参加の枠組みや資金についての話などが、今急速に動き始めています。枠組みや体系、誰が何をするのかといったことが、おそらくはこれからの半年で決まるでしょう。

ここに向けてわれわれとしては、どういう環境にすべきだという提言もしますし、むしろ実装する側としても、いわゆるパビリオンを立てるのではなく、プラットフォームとしてのコモングラウンドを作る。それをやらせてもらう代わりに、そこで何をしたいのか、要はアプリとしての実装は広く公募したいと思っています。

そのようにして、こういうプラットフォームがあるとこんなアイデアが出てくる、それを実装する時には何が課題になり、何が効果になるのかということを若干失敗してもいい環境で明らかにするというのが、おそらくは今回の万博のレガシーになってくるのではないでしょうか。

ということで、大阪には「Common Ground Living Lab」という実際の場所を作りつつ、そのデジタルチェーンを複数の記述形式で作り、物理世界とバーチャル世界をいかに連動させていくか、そのためにはどんな記述形式が適していて、そこにどんなセンサーやマーカーをどう置いていったら複合的にさまざまなサービスに対応できるのかといったことに関して、実証実験を始めてもいます。

豊田さん

こういったところは民間の勝手連的にやっているものなので、ぜひ皆さんにも参加していただきたいです。

先ほど言ったプラットフォームの実装の部分は、できれば東大生産研として協力の体制を作りたいとも考えており、まずは駒場にあるリサーチキャンパスをスキャンし、コモングラウンド・プラットフォーム化することを進めています。その中でどうやってARクラウドやSLAM環境の共有化・汎用化ができるかは、産学連携の形で、広く実装・実証実験の担い手を募っていきたい。

そのために先日、生産研内に「持続可能性志向インタースペース寄付研究部門」という広域の研究部門を、そしてそれをベースに、GPS、都市、建築、ゲームといったさまざまな領域に関する研究室を一つに統合した「インタースペース連携研究センター」を新たに立ち上げました。

豊田さん

ここまでお話ししたことは、産だけでも官だけでも民だけでも学だけでもできない。多様なことが集まって初めて動ける、投資ができるという三すくみ、五すくみの状況がいろいろなところでできていると思います。

ですから、万博のようなイベントをうまく使って、また東大の施設などもうまく使っていただいて、1社、1業態ではできない次世代の産業パッケージを作っていくことに、皆さんと一緒に取り組めたらと思っています。

文/鈴木陸夫

アーカイブ

『BIT VALLEY 2021』概要

イベント名※全7回で開催

BIT VALLEY 2021 ~変わる働き方とカルチャー、変えるテクノロジー~

<各回タイトル(予定)>
#01 Local × Startup 『街とStartup』
#02 Hello, Tech! 『触れて、学んで、楽しむ』
#03 Welcome to New World 『テクノロジーが叶える新しい世界』
#04 Power of Digital 『最新DX事情 〜デジタルの力でより豊かに〜』
#05 Tour of Work From Anywhere 『WFAの可能性を探る』
#06 Build Another Career 『副業・兼業でキャリアを広げる』
#07 Guide to Work From Anywhere 『WFA環境の整え方』

・開催期間:2021年7月〜11月(予定)
・開催場所:オンライン(LIVE配信)
・対象:テクノロジーによる社会の変化に関心のある方
・参加費:無料 ※参加登録が必要です

主催
BIT VALLEY運営委員会
(株式会社ミクシィ、株式会社サイバーエージェント、
株式会社ディー・エヌ・エー、GMOインターネット株式会社)

後援
東京都、渋谷区

特別協力
東急株式会社、青山学院

・イベントURL:https://2021.bit-valley.jp/
・Twitter:https://twitter.com/bitvalley_jp
・ハッシュタグ:#bitvalley2021

Xをフォローしよう

この記事をシェア

RELATED関連記事

RANKING人気記事ランキング

JOB BOARD編集部オススメ求人特集





サイトマップ