楽天、日本語に最適化した新たなAIモデルを発表

楽天グループ(楽天)は18日、Mixture of Experts(MoE)(*1)アーキテクチャを採用した新しい日本語大規模言語モデル(LLM)「Rakuten AI 2.0」と、楽天初の小規模言語モデル(SLM)「Rakuten AI 2.0 mini」の2つのAIモデルを発表した。両モデルは、AIアプリケーションを開発する企業や技術者などの専門家を支援することを目指しており、来春を目途にオープンソースコミュニティに向けて公開予定。

「Rakuten AI 2.0」は、2024年3月に公開した日本語に最適化した高性能なLLMの基盤モデル「Rakuten AI 7B」を基に開発した8x7BのMoE基盤モデル(*2)。本LLMは、8つの70億パラメータで構築した「エキスパート」と呼ばれるサブモデルで構成されている。トークンはルーターによって選定された最も適した2つの「エキスパート」に処理される。それぞれの「エキスパート」とルーターは共に高品質な日本語と英語の言語データを用いた継続的な学習を行っている。

楽天が初めて開発したSLM「Rakuten AI 2.0 mini」は、15億パラメータの基盤モデル。本SLMは、内製の多段階データフィルタリング、アノテーションプロセスを通じてキュレーションおよびクリーンアップされた広範な日本語と英語のデータセットで最初から学習されており、テキスト生成において高性能かつ高精度な処理を実現している。

「Rakuten AI 2.0」は、入力トークンに対して最も関連性の高い「エキスパート」を動的に選択する高度なMoEアーキテクチャを採用しており、計算効率と性能を最適化する。本LLMは、8倍規模の高密度モデルに匹敵する性能を発揮するが、消費計算量においては1/4程度に抑えることができる。

(*1)Mixture of Expertsアーキテクチャは、モデルが複数のサブモデル(エキスパート)に分割されているAIモデルアーキテクチャ。推論および学習中は、最も適したエキスパートのサブセットのみがアクティブ化され、入力処理に使用されることで、より汎用的で高度な推論を行うことができる。
(*2)基盤モデルは、大量のデータで事前学習され、その後特定のタスクやアプリケーションに微調整できるモデル。

関連URL

楽天グループ

関連記事

注目記事

  1. 2024-12-20

    「生成AI大賞2024」受賞結果を発表、グランプリは名古屋鉄道・他7団体が受賞

    Generative AI Japan「GenAI〈ジェナイ〉」)は19日、日経BPが発行・運営する…
  2. 2024-12-18

    Google、2024年の「Gemini」活用方法トップ10を発表

    Googleは16日、2024 年の「Gemini」活用法トップ10 を発表した。このランキングでは…
  3. 2024-12-11

    Spectee、兵庫県神戸市のAIリアルタイム防災・危機管理サービス「Spectee Pro」導入事例を公開

    防災テックスタートアップのSpecteeは10日、提供するAIリアルタイム防災・危機管理サービス「S…
  4. 2024-12-6

    ホープリヴス、AI映画プロジェクトがクラウドファンディング目標額100%を達成

    ホープリヴスは5日、AI技術と創造性の新たな境界線を押し広げる画期的なプロジェクト、AI短編映画「E…
  5. 2024-12-4

    富士キメラ総研、生成AI関連の国内市場を調査

    マーケティング&コンサルテーションの富士キメラ総研は3日、対話型AI「ChatGPT」の登場以降、注…

カテゴリー

最近の投稿

ページ上部へ戻る