楽天、日本語に最適化した新たなAIモデルを発表

楽天グループ（楽天）は18日、Mixture of Experts（MoE）（＊1）アーキテクチャを採用した新しい日本語大規模言語モデル（LLM）「Rakuten AI 2.0」と、楽天初の小規模言語モデル（SLM）「Rakuten AI 2.0 mini」の2つのAIモデルを発表した。両モデルは、AIアプリケーションを開発する企業や技術者などの専門家を支援することを目指しており、来春を目途にオープンソースコミュニティに向けて公開予定。

「Rakuten AI 2.0」は、2024年3月に公開した日本語に最適化した高性能なLLMの基盤モデル「Rakuten AI 7B」を基に開発した8x7BのMoE基盤モデル（＊2）。本LLMは、8つの70億パラメータで構築した「エキスパート」と呼ばれるサブモデルで構成されている。トークンはルーターによって選定された最も適した2つの「エキスパート」に処理される。それぞれの「エキスパート」とルーターは共に高品質な日本語と英語の言語データを用いた継続的な学習を行っている。

楽天が初めて開発したSLM「Rakuten AI 2.0 mini」は、15億パラメータの基盤モデル。本SLMは、内製の多段階データフィルタリング、アノテーションプロセスを通じてキュレーションおよびクリーンアップされた広範な日本語と英語のデータセットで最初から学習されており、テキスト生成において高性能かつ高精度な処理を実現している。

「Rakuten AI 2.0」は、入力トークンに対して最も関連性の高い「エキスパート」を動的に選択する高度なMoEアーキテクチャを採用しており、計算効率と性能を最適化する。本LLMは、8倍規模の高密度モデルに匹敵する性能を発揮するが、消費計算量においては1/4程度に抑えることができる。

（＊1）Mixture of Expertsアーキテクチャは、モデルが複数のサブモデル（エキスパート）に分割されているAIモデルアーキテクチャ。推論および学習中は、最も適したエキスパートのサブセットのみがアクティブ化され、入力処理に使用されることで、より汎用的で高度な推論を行うことができる。
（＊2）基盤モデルは、大量のデータで事前学習され、その後特定のタスクやアプリケーションに微調整できるモデル。

楽天、日本語に最適化した新たなAIモデルを発表

関連URL

関連記事

AI inside とノーコードアプリ開発のユニフィニティーが連…

シェアモル、Transcopeで書いた記事をWordPressに…

アドビ、「#Photoshop生成AIチャレンジ」キャンペーン開…

Pictoria、「AI」VTuber「紡ネン」が幼児期から学童…

オムニス、画像生成AIに特化したオリジナルプレイブック「Open…

注目記事

企業の45%が生成AIを利用、日常業務では80%超の企業が利用成果を認識 =JIPDECとITR調べ=

BizTech、『今さら聞けない！ChatGPT基本のキ』ホワイトペーパー公開

アイスマイリー、「AIエージェントカオスマップ 2025」を公開

ベクトル、人材業界向け「ChatGPTを活用した顧客体験の進化と収益向上方法をまとめたレポート」

「AI博覧会 Spring 2025」3月27日・28日開催

カテゴリー

最近の投稿

サイト情報

アーカイブ

カテゴリー

AIRobot-NEWS

Society5.0時代のAI・Rboto情報

楽天、日本語に最適化した新たなAIモデルを発表

関連URL

関連記事

注目記事

カテゴリー

最近の投稿

タグ

サイト情報

アーカイブ

カテゴリー

Society5.0時代のAI・Rboto情報