アイキャッチ

【3分で抑える】生成AIの種類は五つ!法人向けや日本語対応も加速する、注目の生成AI企業を木内翔大がピックアップ

ITニュース

生成AI活用普及協会理事・木内翔大が解説

3分でつかむ!AIビジネストレンド

この連載では、生成AI活用普及協会理事でGMO他複数社でAI顧問を務める木内翔大さんが、エンジニアの仕事力向上&キャリアアップに役立つAIビジネストレンドを、仕事合間の3分でさっくり読めるコラムで紹介! 業務効率化に役立つAIツールの情報や、今月おさえておきたいAI関連のニュースをお伝えしていきます。

こんにちは。AI活用コミュニティSHIFT AI 代表の木内翔大です。

前回のコラムでは、生成AIの発展によってエンジニアの立場や役割が変わってきていて、それに伴い必要なスキルや知識が変化していることをご紹介しました。

そして今回は、その必要なスキルの中でも特に重要な、生成AIに関するキャッチアップについてお話ししようと思います。生成AIの種類や導入事例、トレンドについて具体的な企業やサービス名を挙げながらご紹介するので、ぜひ参考にしてみてください。

プロフィール画像

株式会社10X 代表取締役
木内翔大さん(@shota7180)

元・株式会社SAMURAI 代表取締役。一般社団法人生成AI活用普及協会 GUGAの理事を務めながら、GMO AI & Web3株式会社 顧問としても活動。大学時代からフリーランスのWEB・AIエンジニアとして3年ほど活動。2013年に日本初のマンツーマン專門のプログラミングスクールである「SAMURAI ENGINEER」を創業。累計4万人にIT教育を行い2021年に上場企業へ売却。「日本をAI先進国に」をテーマにSNSを中心に生成AIについて発信している

生成AIの種類について

(仮)木内さん連載

ChatGPTを筆頭に注目を集めている生成AIですが、その用語自体に明確な定義は存在せず、現在では広義的に”AIを利用してデータやコンテンツの生成を行う技術”を指しています。生成されるデータやコンテンツは多岐にわたり、特に注目されている分野は大きく次の五つになります。

文章生成AI(LLM)

LLMは大規模なデータセットを用いて訓練された自然言語処理モデルの一種で、チャットボットなど主に文章生成に使用され、ChatGPTに使用されているGPT-3.5/GPT-4などが挙げられます。

他にも文章校正やコンテンツ作成などで活用されており、現在もさまざまな種類のLLMが開発されています。

コード生成AI

コード生成AIは、自然言語処理や機械学習を用いてプログラムコードを生成してくれるAIです。主に1からコードを生成するものと、既存のコードの修正を行ってくれるものに分かれ、ソフトウエア開発を効率化し、エラーを減らすことが期待されています。

画像生成AI・動画生成AI

画像生成AIは、基本的に機械学習アルゴリズムを用いて画像を生成する技術です。そして動画生成AIは、画像生成に使われる手法を時間軸に沿って展開することで、連続する画像フレームを生成する技術で、これにより、短いクリップや長い動画を作成することができます。

デザイン生成AI

デザイン生成AIは、グラフィックデザイン、ウェブデザインなどに対して自動または半自動でデザインを生成するAI技術です。

一般的に、機械学習アルゴリズム、特に敵対的生成ネットワークや強化学習などが用いられ、企業が効率的にプロトタイプを作成したり、既存のデザインを改良するプロセスを加速させる可能性があります。

オーディオ生成AI

オーディオ生成AIは、音声や音楽を自動生成するAI技術です。この分野でよく用いられるアルゴリズムには、WaveNet、敵対的生成ネットワーク、LSTM(長短期記憶)などがあり、リアルな人間の声を模倣したり、新しい音楽トラックを生成したり、さまざまな音響効果を作り出すことが可能です。

各分野で注目の企業とサービス

文章生成AI(LLM)

・OpenAI – ChatGPT(GPT-3.5/GPT-4)
ChatGPTは言わずと知れたAIチャットボットですが、公開からわずか2カ月で利用者が1億人を超えるなど全世界で注目を集めています。

その精度はLLMの中でも突出しており、ディープラーニングのモデルであるTransformerを基にした独自のアルゴリズムと膨大な学習量で自然な対話を実現しています。今年8月にはエンタープライズ版もリリースされ、これからさらに企業導入が加速していくと予測しています。

(仮)木内さん連載

・Meta – Llama
LlamaはMeta AIが研究者、開発者向けに開発したLLMで、70億パラメータから650億パラメータまでさまざまなサイズのモデルが存在し、その精度はGPT3.5に匹敵するとされています。

そして、同LLMで注目すべきなのがオープンソースである点です。GPTがクローズドなのに対し、Llamaは研究者、開発者がカスタマイズして特定のニーズに合わせて使用することができるため、さまざまな用途で期待されているLLMです。

・Stability AI – Japanese StableLM
Japanese StableLMは日本語向けのLLMで、ウェブを中心とした大規模なデータと、独自で作成したデータセットなどを用いて学習しており、日本語における精度を測るためのテスト「JGLUE(Japanese General Language Understanding Evaluation)」のタスクにおいても高いスコアを得ています。

また、生成AI市場で先端を行くStability AIという企業が日本語対応を行ったことで、国内外で日本語対応LLMの競争が激しくなると予想しています。

コード生成AI

・Meta – Code Llama
Llamaをベースに、コードに特化したデータセットで訓練したモデルで、最高水準の評価「SOTA(state-of-the-art)」を達成しています。

注目すべき点としては、長いデータを学習に使用しているため、行数の多いコードに対しても高い精度の回答を得られる点が挙げられ、単純に新規のプログラムを出力するだけでなく、コードの補完において高いパフォーマンスを発揮します。

・GitHub – GitHub Copilot
ソフトウエア開発のプラットフォームを運営しているGitHubが提供しているサービスで、プログラマーが記載したコメントや関数などから、AIが最適なコードを推測し提案してくれます。

GitHubは今年1月にユーザーが1億人に到達したことを発表しており、そのほとんどがエンジニアであることを考えると、そのようなサービス内にコード生成AIが導入されたことは大きなインパクトがあると考えられます。

画像生成AI

・Stability AI – Stable Diffusion
Stable Diffusionは2022年8月に日本上陸したAIです。プロンプトを入力するだけで多様な画像を生成することができ、人物の生成を得意としています。

また、その精度の高さからAIの学習用としても注目されており、実際にStable Diffusionが生成したレントゲンの画像で学習した医療用AIが性能を改善した報告があるなど、各分野で活躍が期待されています。

(仮)木内さん連載

引用 : https://hai.stanford.edu/news/could-stable-diffusion-solve-gap-medical-imaging-data

・Midjourney – Midjourney
Discordというチャットサービス上で動作する画像生成AIで、有料ですが簡易的なプロンプトで画像を生成することができます。

しかし、非常に高品質な画像を生成するMidjourneyですが、2022年時点で従業員が10名という、元NASA研究者のデビッド・ホルツが自己資金で運営していた小規模な企業なんです。

そして、その事業は資金調達や上場を目的とせず、楽しみだけで行っているとのこと。そのような考え方だからこそ生まれるクリエーティブな発明があるのではないかと、今後も期待しています。
・OpenAI – DALL-E
DALL-EはChatGPT Plusまたは企業向けのChatGPT Entrepriseでリリースされました。その最大のポイントは、ChatGPT上で動くため高い文章読解力を持っている点です。

これにより、複雑なプロンプトに対しても、細かいニュアンスや指示を理解し、正確な出力を行うことができます。また、最新版のDALL-E 3は画像品質がDALL-E 2より大きく改善されており、今後も精度は上がっていくことが予想されます。

(仮)木内さん連載

引用:https://twitter.com/sama/status/1704547627583553961

動画生成AI

・Runway Research – Gen-2
Gen-2にはテキストからの動画生成と、画像からの動画生成を行う二つの機能があり、最大16秒の動画を生成することができます。

特徴としては、細かい設定をしたい時に、テキストと画像の両方から指示を出し生成を行うことができるため、よりリアリティーと忠実性の高い精度が期待できます。
・GliaCloud – GliaStudio
GliaStudioはウェブサイト内のテキストや画像を元に、30秒〜1分ほどの動画を自動生成することができます。

注目したいポイントは、ウェブサイトから生成した動画は、元となったウェブサイト内のコンテンツと親和性が高くなるため、ユーザビリティを担保することができる点です。

そのため導入がしやすく、これから多くのウェブサイトで使用されるでしょう。

デザイン生成AI

・Microsoft – Designer
Designerはデザインを簡単かつ迅速に作ることができる生成AIです。その用途は幅広く、ロゴやアイコンの生成はもちろん、画像生成、画像を元にしたレイアウトの提案など多機能です。

さらにSNSとも連携しているため、作ったものをそのままSNSに投稿することができ、広報などで重宝されるサービスであると感じています。

・Designs.ai – Designs.ai
Designs.aiは、さまざまなAI技術を用いた統合型プラットホーム。その特徴は統合されている機能の充実さで、ロゴに特化した画像生成、そして動画生成やライティングなどを行うことができ、このツール一つでウェブサイトのデザインを完結させることもできます。

また、簡単にプロジェクトリンクを共有することができるので、グループのプロジェクトでも活躍することができます。

オーディオ生成AI

・Meta – AudioCraft
・エフェクトやサウンドスケープを生成する「AudioGen」
・テキストからメロディーを生成する「MusicGen」
・ニューラルネットワークベースのオーディオ圧縮コーデック「EnCodec」
AudioCraftは上記三つのモデルで構成されており、高品質なオーディオ、音楽を生成することができます。

そして、それらをオープンソースとしてリリースしているため、クリエイターが独自で調整を行いモデルを作成し、オーディオ生成AIを進化させる機会を提供しています。

・University of Surrey, Imperial College London – AudioLDM
AudioLDMは複数の大学が合同で作成しているモデルで、音質の面で最高水準の評価「SOTA(state-of-the-art)」を達成しています。機能としては、特定の曲やアーティストを参考に音楽生成を行ったり、音楽のジャンルやスタイル、さらには感情やテーマなどを指定して生成することもでき、その高い精度から注目を集めているモデルです。

(仮)木内さん連載

引用 : https://audioldm.github.io/

進んでいく生成AIの導入

生成AIの発展に伴い、さまざまな企業で導入が進んでいますが、生成AIは倫理的な問題や偽情報の拡散など、注意が必要な側面もあります。そこで今回は、これまでにうまく行った生成AIの導入事例をご紹介します。

生成AIの導入事例

【国内の事例】
・日清食品ホールディングス株式会社
日清は言わずと知れた国内屈指の食品メーカーですが、国内ではいち早くAIチャットボットを導入。ChatGPTが出た際にその利用リスクと有用性を分析し、Microsoft、OpenAIとセキュアな環境を作り上げて、生産性向上の実現を目指しています。
・ソフトバンク株式会社
ソフトバンクでは、法人サービスの顧客窓口に対応している部門でセキュアな社内GPTを構築し活用。現在は自社データをどのように活用するかを検討しており、次世代の生成AI活用に向けて環境の拡充を進めています。

【国外の事例】
・AP通信(Associated Press)
AP通信はニューヨークに本部を置く通信社で、ニュース制作、配信において生成AIを導入しました。具体的には、動画のショットリストや記事の要約を自動生成することで、ワークフローの合理化を図っています。
・エクスペディア(Expedia)
オンライン旅行代理店最大手であるExpediaは、2023年4月初頭に、同社のモバイルアプリ内でChatGPTを利用したチャットによる旅行プランニングガイドを公開。質問に応じて旅行プランを提案してくれるサービスを行っています。

まとめ

今回は、生成AIの種類や導入事例、トレンドについてご紹介しました。生成AIは急速に進化しており、生成AIサービスの基本的な理解やトレンドのキャッチアップはエンジニアにとって非常に重要になっています。今回ご紹介した企業やサービスも数年後には見ることがなく、他の企業が台頭しているかもしれません。しかし、そのすさまじい変化こそがAI業界の怖さであり、面白さでもあると言えるでしょう。

また、導入事例では国内外でそれぞれ2社ずつご紹介しましたが、国内では社内向けのセキュリティーを重視した生成AIが多く見られた反面、国外ではセキュリティーを加味しながらもとりあえず試してみるような動きが多く、国内外で進め方が違うことがわかります。

今後も国内外の動向に目を向けつつ、最新技術のキャッチアップを行い、生成AIの発展に乗り遅れないようにしましょう。

Xをフォローしよう

この記事をシェア

RELATED関連記事

RANKING人気記事ランキング

JOB BOARD編集部オススメ求人特集






サイトマップ