アイキャッチ

中国発AI音声認識「iFLYTEK」の技術力に学ぶ、“伸びる”会社に必要なモノ

働き方

本連載では、海外AIトレンドマーケターとして活動している“AI姉さん”ことチェルシーさんが、AI先進国・中国をはじめとする諸外国のAIビジネスや、技術者情報、エンジニアの仕事に役立つAI活用のヒントをお届けします!

プロフィール画像
   

海外AIトレンドマーケター | AI姉さん
國本知里・チェルシー (@chelsea_ainee)

大手外資ソフトウェアSAPに新卒入社後、買収したクラウド事業の新規営業。外資マーケティングプラットフォームでアジア事業開発を経て、現在急成長AIスタートアップにて事業開発マネジャー。「AI姉さん」としてTwitterでの海外AI事情やトレンド発信、講演、執筆等を行っている

皆さん、こんにちは。AI姉さんことチェルシーです。

この連載では13回にわたり、「海外AIビジネス事情」をお届けしてきました。今回は特別編として、中国発の注目AI企業、iFLYTEKの日本法人、iFLYTEK JAPAN AI SOLUTIONSを取材しました。

同社はAI技術を用い、高精度の翻訳機を展開している企業で、2020年の設立から今後急拡大が期待されています。代表の馮躍さん、COOの孫嘉人さんに話を伺うと、iFLYTEK JAPAN AI SOLUTIONSの成長の裏に隠された、中国本社の研究開発へのダイナミックな姿勢が見えてきました。

iFLYTEK JAPAN AI SOLUTIONS 馮さん、孫さん

(写真左)iFLYTEK JAPAN AI SOLUTIONS株式会社
取締役副社長兼COO 孫 嘉人(ソン ヨシト)さん

中国出身。日本の音声合成ベンチャーで研究者として勤務後、日立製作所で多言語音声翻訳ソリューション推進を担当。その後、2020年1月にiFLYTEK JAPAN AI SOLUTIONS(株)を共同設立

(写真中央)代表取締役社長 馮 躍(フォン ユン)さん
中国出身。1990年頃に研究者として来日。IT関連の業務を日本で行った後中国に帰国。iFLYTEK本社の日本顧問・代表を務めた後、2020年1月にiFLYTEK JAPAN AI SOLUTIONS(株)を設立

(写真右)聞き手:國本知里(AI姉さん・チェルシー)

10年越しで叶った日本進出。オリンピックを期に、中国から世界へ

――初めに、どのような経緯で、iFLYTEK JAPAN AI SOLUTIONSを立ち上げたのでしょうか?

馮:私は1990年頃に流体力学の研究者として日本に来て、2000年頃からIT関連の仕事をしていましたが、11年前の金融ショックで仕事がなくなり一度中国に帰りました。

元々iFLYTEKの本社がある合肥(ごうひ)がふるさとで、iFLYTEKが出来た当初から知っていたのですが、中国に帰ってから、設立者の劉慶峰(リュウ・ケイホウ)と出会う機会があったのです。彼と話をして、iFLYTEKの技術や将来性を確信し、日本の有力な音声関連の技術者も中国に連れて、11年前にiFLYTEK本社の日本の顧問・代表を務めることになりました。

その頃、iFLYTEKも20年の歴史があるため今後は国際化をしていこうと、2018年のCESで発表をしました。その中で、今は日本の優先度が今は最も高いということになり、日本語の研究リソースを投下し、精度を向上させ続けました。そして2020年にオリンピックがあることも踏まえ、設立者の劉からやっと了承を得て、2020年1月に日本法人を設立したのです。

iFLYTEK JAPAN AI SOLUTIONS 馮さん、孫さん

孫:私は2000年頃に中国から留学生として日本にやってきて、卒業後は日本語の音声合成に特化したベンチャーに就職し、音声合成の研究員として働いてきました。

それから、日立製作所に転職して、多言語音声翻訳ソリューション推進の担当をしていました。主に多言語音声認識、音声翻訳領域に携わり、オリンピックに関する事業を4~5年前から推進していたのです。その背景もあり、iFLYTEKから声を掛けていただきました。

今の日本の音声技術に関するマーケットの状況を考えると、iFLYTEKの日本進出は日本のイノベーションに必要だと感じました。日本のビジネスチャンスに貢献したいという思いで、iFLYTEK JAPAN AI SOLUTIONSの設立に携わることになったのです。

中国でのノウハウを日本でワンストップで提供する

――iFLYTEKの多言語翻訳機は、一番最初に日本で出されましたよね。
iFLYTEK JAPAN AI SOLUTIONS 馮さん、孫さん

孫:元々のお話をすると、日本にiFLYTEKのビジネスチャンスを感じていた背景の一つとしては、日本は従来音声合成領域の研究において、実は中国より歴史が長いという点です。とはいえ日本は研究要素が中心で、どのように現場で応用するかが確立されておらず、現場の課題を解決できずにいました。

一方で、iFLYTEKの強みは音声合成・音声認識・多言語翻訳・OCR・対話の自然言語解析など、全てのコア技術を自社で持っており、更にソリューションとして提供している点です。

例えば、金融の場合はビッグデータから顧客の声や状況が分かりますよね。更に窓口でサービスを受ける時に、スタッフと顧客の対話を音声認識して、デジタル文字に変換することで、より一層ビッグデータの活用がイメージできますよね。

ですが、これを実現しようとすると、マイクや周りの雑音の課題、またどのようにサービスを提供するかなど、行き詰るところがたくさんあるわけです。ここに日本の大企業も課題を多く抱えています。

iFLYTEK JAPAN AI SOLUTIONS 馮さん、孫さん

孫:ディープラーニングが世の中に出てきたことで、従来よりも音声認識、音声合成などの技術的ハードルが下がってきました。データがたくさんあり、ツールがあればある程度のところまでは実現できるようになりました。日本にも音声認識をやっている会社、音声合成をやっている会社は少なくありませんよね。

ただし、 実際に使う時にいかに具体的な商品、サービス、ソリューションの形に実現してユーザーに届けるかを考えるのならば、要素技術を伸ばすだけでなく、それぞれの企業が連携し、要素技術を有効に組み合わせることが重要になります。

その点で、iFLYTEKは音声合成の国際コンテストにおいて14年連続世界1位、また音声認識において最も厳しい国際コンテストであるCHiMEでも3回連続世界1位を受賞しています。革新的な企業として、iFLYTEKは自社技術を元にコア技術革新にこだわっています。自社でそれらのあらゆる要素技術をディープに連携できることによって、多数の商品とサービスの提供に成功しました。今後はこういった商品とノウハウを日本の顧客に届けたいと思っています。

iFLYTEK JAPAN AI SOLUTIONS 馮さん、孫さん

売上の25%は研究開発へ投資。試行錯誤出来る環境でまずは実験を

――競争率の高い中国でiFLYTEKが伸びた理由は何なのでしょうか?

孫:それは三点あります。

一つ目は、コア技術に関する投資ですね。iFLYTEKでは売り上げの25%を研究開発に投資しています。創設者の劉は中国の有名大学出身で、さらに22年間ずっとこの領域やっています。いち早くAI領域におけるコア技術を持っていないと勝てないと気付き、技術の確立・成長を最優先で考えているのです。

二つ目は、試行錯誤できる環境です。例えば、日本だと社会でどう活用するのか明確になっていなかったり、法的な問題があったりと、アルゴリズムを現場で試用して精度を高めていくのは難しいのです。中国の場合、まずは現場で実験してみようという社会環境があります。そこで一気に精度を高めていくことができています。

馮:中国は技術だけでなく、運用面が強いんですよ。iFLYTEKの大株主はチャイナ・モバイルです。大規模の通信インフラを整備していく上で、われわれも発展しました。

三つ目は、高度な人材の確保です。

馮:iFLYTEKの社員数は現在15,000人ほどに増えましたが、その3分の2以上がエンジニアで、研究員は3000人ほどです。

当社は2010年から、音声の会社ではなく、「AIの会社」として打ち出してきています、そのためエンジニア採用においても、音声技術に特化せず、基本技術だけない機械翻訳・OCR等も含めて多様なスキルを持った人材を採用しています。

iFLYTEK JAPAN AI SOLUTIONS 馮さん、孫さん

コロナ禍のオンライン会議・オンラインイベントの課題をコアAI技術で解決していく

――iFLYTEK JAPAN AI SOLUTIONSとしては日本でどのように事業を展開していく予定ですか。

馮:柱としてはコンシューマー向けです。新型コロナウイルスの影響で全世界的に、会議やイベントのオンライン化が進みました。その中で、インターネット上の展示会で、同時翻訳・書き起こしのニーズも増えてきています。

iFLYTEKでは、主力サービスである自動翻訳機のほか、6年前から『iFLYREC』という自動文字起こしのサービスを開始しており、中国国内での重要ないくつかの発表会や会場に、iFLYRECのリアルタイム翻訳および自動文字起こしサービスを提供したことがあります。

現在日本語から中国語への自動翻訳・書き起こしはできるようになってきており、今年の3月までに日本語・英語の自動翻訳・書き起こしができるように準備しています。

孫:日本では2020~2021年はコンシューマー向けに消費者の手に届くもの、コロナウイルスの対策になるものなどを提供していきたいと思っており、日本語の音声認識、翻訳精度もあげていきます。中国ですでに成功している商品を日本語化していくことはもちろん、日本市場に合わせながらソリューションを展開していく予定です。

あとがき

iFLYTEKの優れている点は、ワンストップでサービスを提供していることです。近年国内でも、AI議事録のようにAIによる音声テキスト化のソリューションも増えてきました。ですが、音声認識ができてもリアルタイム翻訳まではできないため、テキスト化した後に別の翻訳エンジンを使わなければいけないようなこと、前処理の技術によっては音声認識精度に偏りがあることなどが課題になっています。iFLYTEKであれば、現場で出てくる上記の課題を全て同社のソリューションで解決することができます。

日本では完璧主義の文化があり「100%に近い精度でないと難しい」「全ての要件を満たさないと導入できない」ということはよくあります。しかし、iFLYTEKは技術革新にこだわり、常にソリューションを増やし、顧客に提供しながら更に技術を磨いています。国内のスタートアップやエンジニアでも学ぶべきポイントですね。

取材・文/チェルシー AI姉さん(國本知里)

Twitterをフォローしよう

この記事をシェア

RELATED関連記事

RECOMMENDEDあなたにオススメ

RANKING人気記事ランキング

JOB BOARD編集部オススメ求人特集





サイトマップ