第2章: 生成AIの最新動向

目次

技術概要と進化のトレンド

生成AIの中核となる技術は、大規模言語モデル(LLM: Large Language Model)や生成モデルと呼ばれるAIモデルです。代表例のGPTシリーズ(ChatGPTの背後にあるモデル)は数千億〜数兆ものパラメータを持ち、インターネット上の膨大なテキストで訓練されています。その結果、人間と遜色ない文章の理解と生成が可能となりました。また画像分野では、ディープラーニングによる画像生成モデルが進化しています。2014年頃に登場したGAN(敵対的生成ネットワーク)から始まり、近年は拡散モデルという手法(Stable Diffusionなどが採用)が高品質な画像生成を実現しています。

技術トレンドとしては、モデルの大規模化高性能化が引き続き進んでいます。たとえばOpenAIのGPT-4は前世代よりも知的応答の正確性が向上し、複雑な指示にも対応できる汎用性を示しました。また、マルチモーダル化(テキストだけでなく画像や音声も入力・出力できるようにする)が進んでおり、文字を読んで画像を生成するだけでなく、画像を解析して説明文を生成したり、音声で質問して文章回答を得ることも可能になりつつあります。実際GPT-4は画像入力にも対応(制限付き)しており、一つのAIが複数のデータ形式を扱える時代が見えてきました。

一方で、モデルの軽量化・効率化という逆のトレンドも注目されています。巨大なモデルは動作に莫大な計算資源を必要とするため、中小企業がオンプレミスで利用するにはコストが高いのが課題でした。そこで、モデルを圧縮・最適化して小規模な計算環境でも動かせるようにする研究も盛んです。日本ではNTTが独自の日本語特化LLM「tsuzumi(鼓)」を開発し、わずか70億パラメータでもGPT-3.5並みの日本語性能を達成しています (NTT独自の大規模言語モデル「tsuzumi」を用いた商用サービスを2024年3月提供開始 | ニュースリリース | NTT)。tsuzumiは超大規模モデルの約1/25のサイズで動作し、1GPUや場合によってはCPUでも高速動作が可能とのことで、消費電力やコストを大幅に削減できると報じられています (NTT独自の大規模言語モデル「tsuzumi」を用いた商用サービスを2024年3月提供開始 | ニュースリリース | NTT)。このように、小さくても高性能なモデルの登場は、中小企業でも自社データを使ったカスタムAIを構築・運用しやすくなることを意味します。

ベンダー動向とエコシステムの拡大

生成AI分野には現在、テクノロジー大手企業からスタートアップまで多様なプレイヤーが参入しています。グローバルには、OpenAI(Microsoftの支援を受ける)がGPTシリーズと言語モデルAPIで先行し、GoogleもPaLM 2や画像生成のImagenなど独自モデルを開発、対話AIのBardとして提供を始めています。Meta(Facebook)は自社の大規模言語モデルLLaMAを研究目的で公開し、これを基にしたオープンソースの派生モデルも数多く登場しました。Amazonもクラウド上でさまざまな生成AIモデルを利用できるサービス(Bedrockなど)を発表し、主要クラウド各社が生成AI機能を提供する競争が激化しています。

日本国内でも、大手企業が相次ぎ生成AIへの取り組みを表明しています。前述のNTTのほか、ソフトバンクも生成AIスタートアップへの大型出資や国内での大規模モデル構築計画を発表しています。国立情報学研究所(NII)は**「大規模言語モデル研究開発センター」**を新設し、信頼性の高い国産LLMの研究開発を加速しています (生成AIモデルの透明性・信頼性を確保する研究開発を加速〜 – 国立 …)。また、東大発のスタートアップやベンチャーも、日本語特化の対話AIやクリエイティブAIサービスを展開し始めています。日本の生成AI企業としては、LINE出身者が立ち上げたrinna(リんな、会話AIキャラで有名)が独自の日本語モデルを公開したり、スタートアップのHugging Face Japanやデータグリッドなどが画像生成AIの商用利用を支援するなど、多様なプレイヤーが群雄割拠の様相です (【2025年最新】日本の生成AI企業18社!大手からベンチャーまで紹介)。

こうしたモデル開発企業・提供企業に加え、それらを活用したサービスやコンサルティングのエコシステムも拡大しています。典型例として、米コンサル大手Bain & CompanyはOpenAIと提携し、企業への生成AI導入支援サービスをいち早く展開しました (Bain & Company announces services alliance with OpenAI to help …)。この提携の最初の顧客となったのが後述するコカ・コーラ社です。日本でも、日系コンサル各社やITベンダーが「生成AI活用支援」と称してワークショップや導入コンサルを提供し始めています。また、ChatGPTや画像生成AIの使い方を社員に教育する研修ビジネスも登場しています (〖事例7選〗生成AIをマーケティングに活用する3つの方法 – AI総研|AIの企画・開発・運用を一気通貫で支援)。さらに、生成AIと他のシステムを連携させるプラグインやAPI連携ツールも充実してきました。たとえばChatGPTには外部知識ベースに接続するプラグイン機能が追加され、ウェブ検索や在庫データベースと連携して回答できるようになるなど、単体のAIを越えてエコシステムとして機能する方向に進んでいます。

このように、生成AIを取り巻く環境は「モデル→プラットフォーム→サービス」という層構造で急速に整備されつつあります。企業にとっては、自社でモデル開発をするだけでなく、既存のエコシステムをどう活用するかが重要になります。適切なパートナーを選び、社内システムとの統合を図りつつ、自社の業務や製品に生成AIの力を組み込んでいく戦略が求められるでしょう。

研究開発と社会受容

技術開発の側面では、生成AIの課題を克服する研究も盛んです。その一つが**「AIの出力の信頼性向上」(AIアライメント)です。大規模モデルはしばしば事実と異なる回答(いわゆる「幻覚」)を生成するため、正確性を高めるための工夫が進められています。OpenAIはGPT-4で人間フィードバックによる強化学習(RLHF)を強化し、より事実に忠実で有害な発言を避ける調整を行いました。それでも完全ではないため、第三者情報との照合や専門特化モデルとの組み合わせ**など、多角的に信頼性を高める試みが続いています。また、生成AIの説明可能性(なぜその出力に至ったかを説明すること)を確保する研究や、偏見・差別表現を除去するフィルタリング手法の研究も重要です。

一方、社会的な受容とルール作りも進展しています。欧州連合(EU)は包括的なAI規制である**AI法(AI Act)**を策定中で、生成AIにも透明性義務(AIが作ったコンテンツだと明示する等)を課す見通しです。日本でも政府が2023年に生成AIの利活用について省庁横断のガイドライン整備に乗り出し、個人情報保護や著作権との関係整理が進められています。また企業内でも、生成AIの利用ポリシーを定める動きが出ています。例えば、社内でChatGPTを使う際のルール(機密データは入力しない等)を通達する企業が増えており、安全に生成AIを取り入れるためのリテラシー向上が重視されています。

以上が生成AIを取り巻く最新動向の概観です。それでは次章から、実際に各業界でどのように生成AIが活用され始めているのか、次章で詳しく見ていきましょう。

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

コメント

コメント一覧 (1件)

コメントする

目次