約一週間前の4月1日。
サム・アルトマンは自身のXで、こんなポストをした。
私たちは数ヶ月以内に、推論能力を備えた強力な新しいオープンウェイト言語モデルをリリースすることに胸を躍らせています。開発者の皆さまに、このモデルを最大限に活用する方法についてお話したいと考えています。
サム・アルトマン
X投稿
これは「GPT-2以来、初のオープンウェイト言語モデルのリリース」になるとのことで、開発にあたり、いくつかの課題点を解消するべく、開発者から直接フィードバックをもらうイベントを開催するとして参加を呼びかけている。
そもそも、オープンウェイト言語モデルとは何か。
日本の開発者や研究者でも参加チャンスはあるのか。
この募集から透けてみえるオープンAIの狙いを含め、AI研究者の今井翔太さんに読み解いてもらった。
『生成AIで世界はこう変わる』著者
AI研究者,博士(工学,東京大学)
今井翔太さん(@ImAI_Eruel)
1994年、石川県金沢市生まれ。東京大学大学院 工学系研究科 技術経営戦略学専攻 松尾研究室にてAIの研究を行い、2024年同専攻博士課程を修了し博士(工学、東京大学)を取得。人工知能分野における強化学習の研究、特にマルチエージェント強化学習の研究に従事。ChatGPT登場以降は、大規模言語モデル等の生成AIにおける強化学習の活用に興味。生成AIのベストセラー書籍『生成AIで世界はこう変わる』(SBクリエイティブ)著者。その他書籍に『深層学習教科書 ディープラーニング G検定(ジェネラリスト)公式テキスト 第2版』(翔泳社)、『AI白書 2022』(角川アスキー総合研究所)、訳書にR.Sutton著『強化学習(第2版)』(森北出版)など
ーー今回のOpenAIの発表には、どんな狙いがあるのでしょうか?
「私たちは、GPT-2以来初となるオープンな言語モデルを、今後数か月のうちにリリースする予定です。開発者、研究者、そして幅広いコミュニティの皆さまと協力しながら、ご意見を取り入れてこのモデルをできるだけ有用なものにしていきたいと考えています。OpenAIチームにフィードバックを送りたい方は、以下のフォームにご記入ください。」と書かれている。参照元
おそらく、1月に話題を呼んだDeepSeekの公開とほぼ同じことを行うのでしょう。
最近の生成AIで注目されている「推論機能」というのは、AIが問題を解く際に、まるで人間のように「思考過程まで出力させて、問題について長く考えさせる」ように強化学習することで推論性能を上げたAIモデルのことを指します。
例えば、OpenAIのo1やDeepSeek-R1といったモデルは、難しい問題に対して、答えだけでなく、どうやってその答えにたどり着いたかの過程も示すことができます。
会員限定
typeに登録すると続きをお読みいただけます。
会員登録後、画面が自動で更新されます。
編集/玉城智子(編集部)