アイキャッチ

日本人Alexaチャンピオン伊東知治が魅せられた“曖昧な”VUI開発の世界――「 VUIはエンジニアなら誰でもつくれる」

働き方

    日本国内でも音声ユーザーインターフェース(以下、VUI)への注目度が徐々に高まっている。日本におけるVUIデバイスの普及率は米国と比べるとまだまだ低いが、数年後には私たちの生活に広く浸透する未来がやってくると見られている。

    GUI(グラフィカル・ユーザー・インターフェース)からVUIに変わる、あるいはGUIにVUIが加わることで、エンジニアに求められるスキルはどのように変わるだろうか。

    今回お話を伺ったのは、オランダ在住のフリーランスプログラマー・伊東知治さん。Amazon EchoやGoogle Homeが日本に上陸する前からAlexaをテーマにした勉強会を主催するなど、日本のVUIシーンを牽引してきた一人だ。メンバー数600人を超えるAlexaのユーザーコミュニティ 『AAJUG(Amazon Alexa Japan User Group)』の発起人でもあり、こうした活動が評価されて、2018年にはAlexaチャンピオンとしてAmazonから表彰されてもいる。

    伊東知治さん

    伊東知治さん

    オランダ在住のフリーランスプログラマー。2016年からAWSのユーザーコミュニティ『JAWS-UG』でAlexaをテーマにした勉強会を実施し、Alexaの知見をシェアしてきた。Alexaコミュニティ『AAJUG』発起人で、Alexaチャンピオン(画像:Alexa Day 2019より)

    もともとWindowsアプリのプログラマーだった伊東さんはAlexaと出会い、それまでのシステムとのあまりの違いに衝撃を受け、そこから一気にVUIの世界にのめり込んでいったのだという。一方で、「GUIとVUIとで求められるプログラミングスキルにそう大きな違いはなく、Webエンジニアとして一定の経験があれば、Alexaスキルを実装すること自体は容易」とも話す。

    伊東さんがVUIと出会って受けた衝撃とはなんだったのか。伊東さんが感じるVUIの魅力とは?

    VUIは「間違うことを良しとする」システム

    --伊東さんがVUIと出会って受けた「衝撃」とはなんだったのでしょうか。VUIのどんなところに面白さを感じたんですか?

    通常、僕らエンジニアがプログラムを書くときには、数学のパズルみたいに緻密に論理を積み上げていきますよね。ところがVUIの場合は、論理的に考えてもいい具合に設計することができないんですよ。

    --どうしてですか?

    人間の会話が論理的にはつくられていないからです。曖昧に聞いてもなんとなく意図を理解して、何かしらの返答を返してくれることで成り立つのが会話というもの。VUIも同じで、ユーザーは「ここにこれをこういうふうに書いてください」みたいに、文法的に正しい流れで指示を出してはくれません。それでもある程度意味を汲み取って、それっぽいことを返す必要があるわけです。

    間違えることを前提にした、間違えることを良しとする思想とも言えるかもしれない。「大文字であるはずのところが小文字だと反応しない」といった厳密さを求めるGUIとは、その点が決定的に違う。そこが難しいし、同時に面白いなと思いました。

    --なるほど。そもそも、なぜVUI開発をしようと思ったのですか?

    僕が初めてAlexaと出会ったのは2016年。AWSのコミュニティである『JAWS-UG(Japan AWS User Group)』の神戸支部を前任者から引き継いで、勉強会を主催するにあたってテーマに選んだのが最初でした。

    当時はAmazon Echoが日本に上陸する2年も前なので、デバイスがあるわけではなかった。Amazon公式のドキュメントとか、Raspberry PiでAlexaデバイスのプロトタイプを作成するためのリポジトリをGitHubで探し出して、手探りで開発を始めました。

    その時に作ったのは、質問したら天気とか単語の意味を答えてくれるといった、Alexaの基本機能ばかり。ですが、ちゃんと答えてくれることもあれば、反応してくれないこともあって。それは多分、自分の英語の拙さが原因なんですけど、でも、その曖昧さがすごく人間らしくていいなと思った。うまく答えてくれないところに愛おしさを感じてしまったんです。

    Amazon Alexa イベントの様子(画像:Alexa Day 2019より)

    Amazon Alexa イベントの様子(画像:Alexa Day 2019より)

    --そこからVUIにのめり込んでいくわけですね。

    はい。とはいえ、現状VUIでたくさんお金を稼いでるかと言えば、そんなことはありません。仕事の面では、僕は今も世間一般で言われる「プログラマー」というスタンスであまり変わってないんです。端的に言って、VUIエンジニアとして仕事をするには“早すぎる”んですよね。

    VUIのマーケットはまだ小さく、僕が住むヨーロッパでもそこまで普及しているとは言えないのが現状です。普及率はスマートスピーカーの発売が比較的早く始まったUKで20%、ドイツでも20%程度。オランダにはAmazon Echo自体が来ていません。一方で米国の世帯普及率は40%を超えており、当然人口も多いので、ビジネス市場という意味では米国の方が圧倒的。徐々にVUI絡みの仕事をもらえることも増えましたけど、それでも今はまだ「何ができるか調査したいので、プロトタイプを作ってください」といった段階のものが大半です。

    --ヨーロッパも日本とそれほど変わらないんですね。

    そうなんです。でも、僕としてはそれで問題がなかったんです。すぐに仕事にしたいというよりは、VUIが純粋に面白く、VUIが広まった世界のほうが絶対に面白いはずだという思い込みにも近いモチベーションだったので。

    今後、VUIが普及する未来が来ること自体は確実だと思います。スマートフォンだって最初はいろいろと言われていたけれど、結局は便利さに気付いてみんなが使い始めたじゃないですか。VUIもそれと一緒だと思っていて。焦点はあくまでその未来がいつ来るのか。「声」は当たり前ですが人間が元から持ってるものなので、スマホよりもその土地、国の文化に対する依存度が高いと思うんです。なので、少し時間は掛かるかもしれませんが。

    話す相手は機械だが、必要なのは人間を知ること

    --曖昧さが受け入れられるシステムという点でGUIとは決定的に違う。ということは、VUIの設計をするにはエンジニアとしてそれまで培ってきた純粋なプログラミングスキル以外の能力が求められることになりますか?

    そうですね。ちょっと話が逸れるかもしれないですが、ここオランダで、僕の周りにいるVUIでビジネスを考えている人は、実はエンジニアよりもデザイナーの方が多い印象なんです。オランダがデザイン先進国であることも関係しているでしょうが、一方でそれだけ、VUIにおいてはプログラミングそれ自体よりもデザイン≒設計が重要だし、難しいということなんだと思います。

    開発自体は今後もどんどん簡単になっていくでしょう。するとエンジニアの人の手が空くことにもなるので、エンジニア側にもデザイン方面にまで手を出す人が増えるんじゃないかと予想しています。そうやって将来的にはエンジニアとデザイナーの境界線が溶け合う未来が来るんじゃないかな、と。

    もちろんこれからVUIの普及が進めば、複雑で規模の大きなスキルもきっと増えていくはずなので、VUIデザインやコーディングなど一つのことに特化した人が生きていけないというわけではないと思いますが。

    開発が簡単になることやAI、MLなどの先端技術ワードをネガティブに捉えて「仕事がなくなる」と言って怖がる人もいるけれど、ポジティブに捉えれば、余裕ができて新しいことに時間を割けるようになるとも考えられますよね。ということは、今よりもっと自分の興味に純粋になれるかもしれない。僕自身はそんなふうに前向きに捉えています。ちなみに「民主化によって誰もが簡単に作ることができるようになり、余計なことに手をとられなくなって、本当にやりたいことに注力する」というのは、AWSの基本的な思想でもあります。

    VUIに求められるスキルの話に戻ると、相手は確かに機械なのだけれど、「人間中心設計的な考え方」が必要になります。そういう意味ではコーチングとかプロジェクトマネジメントのスキルが役立つかもしれないし、言葉を扱うという意味ではコピーライティングのスキルも生きる可能性があるでしょう。

    会話を人間っぽくデザインするためには、会話とは何か、言語とは何か、声とは何かみたいなことを突き詰めて考えざるを得なくなります。また、各国の文化の違いなども気になり出します。

    僕はもともと技術そのもののトレンドを追うのが好きなタイプで、Alexaのようなユーザーとやりとりするインターフェースより、むしろ後ろ側の仕組みに興味のある人間だったんです。それが今では、言語学の知見を求めてアカデミックな書籍を読んだり、MITのコースをとったりするようになりました。AmazonやGoogleもそういう分野の専門家を雇うようになっているので、そこから出てくる最新の知見にも注目しています。

    --興味の矛先が変わっていったんですね。

    変わったというよりは新たに加わった感じです。技術トレンドだって相変わらず追っていますし。「Webの技術さえあれば作れる」ということは、Webの技術を磨くことがそのままVUIの開発にも生きるということでもあるので。今も「最終的にはモノを作りたい」というエンジニア的な欲求は変わっていません。そのための発想の源が、VUIと向き合っていたら自然と増えていった感じです。

    身近な困りごとをVUIを使って解決してみよう

    --国内でもVUI関連の事業に挑む企業が少しずつ増えています。新たにVUIに取り組むことになった人は、まず何から手を付けるのがいいですか?

    まずはAmazonとかGoogleが出している公式のデザインガイドを参照することじゃないでしょうか。こうしたドキュメントは最近ではどんどん充実してきていて、細かな会話のケースを想定した脚本みたいなものまであります。これを熟読することがVUI設計の第一歩になるのかな、と。それができたら、次にやるべきことは「とりあえず作ってみる」以外にないと思います。繰り返しになりますが、Webの知識さえあれば作ること自体はそんなに難しくないのがVUIの良いところなので。

    VUIには、何か別の作業をしながらでも、物理的に離れていても操作ができるといった点に、GUIにはない便利さがあります。

    例えば、赤ちゃんのお世話を想像してみてください。一日のほとんどを抱っこをしながら過ごすけれど、体重やミルクをどのくらい飲んだかなど、気になることが多いですよね。ミルクを飲ませながらAlexaに、「今日のお昼は100ml飲んだよ」と伝えて記録を付けることができたらどうでしょう?

    本格的に稼ごうと思ったら考えなければならないことは山ほどありますが、まずはあまり打算的にならずに「身近な問題を解決してみよう」とか「ちょっとバカらしいアイデアだけど面白そうだから作ってみよう」とか、そんな感じからスタートするのがエンジニアっぽくていいんじゃないでしょうか。今では子育てや家事など、暮らしに踏み込んだスキルも多く提供されるようになったので、スキルストアをチェックしてみるのも面白いですよ。

    作る過程で分からないことがあったら、コミュニティを訪ねてもらうのがいいと思います。VUIはまだまだ成長段階ですから、あまりリアルな開発経験やユーザー体験の情報が出回っていない難しさがあります。その数少ない生の情報があるのがコミュニティです。

    僕の運営するAlexaのユーザーコミュニティー『AAJUG』にも登録者は700人くらいいて、その中にはかなり熱量の高い開発者も含まれています。コミュニティの参加者は総じて自身の知見を惜しみなくシェアするオープンな姿勢を持っているので、気軽に聞いてみたら助けてくれると思いますよ。

    VUIコミュニティ・イベント情報

    AAJUG コミュニティページ

    Voice Con Japan 2020
    2020年 3月21日(土) 神戸開催
    国内最大クラスの コミュニティドリブン型 Voice Tech カンファレンス(AAJUG 主催)

    取材・文/鈴木陸夫

    Xをフォローしよう

    この記事をシェア

    RELATED関連記事

    RANKING人気記事ランキング

    JOB BOARD編集部オススメ求人特集





    サイトマップ