2024.03.22 ECモール
楽天、日本語に最適化したオープンな高性能LLMを公開
楽天グループは3月21日、日本語に最適化した大規模言語モデル(LLM)の基盤モデル「Rakuten AI 7B」とインストラクションチューニング済みモデル「Rakuten AI 7B Instruct」、さらにファインチューニングを行ったチャットモデル「Rakuten AI 7B Chat」をオープンなモデルとして公開した。
▽関連記事
楽天とOpenAI、通信業界向けAIツールを開発・提供へ
楽天の株価に連動してポイントが増減…「ポイント楽天株」の提供開始
効率的に事前学習や推論のテキスト処理が可能
同社のLLMは、高品質なデータを使った事前学習によって高性能を実現。フランスのMistral AI社のオープンモデル「Mistral-7B-v0.1」を基に、インターネット上にある膨大な日本語と英語のデータで事前学習を繰り返している。
与えられた条件に従ってデータを選別・抽出する内製のフィルタリング機能と、関連情報をメタデータとして付与するアノテーション作業によって、質を向上させたデータを事前学習に使った。これにより高性能化に結び付けたという。
また、日本語の言語に最適化された独自の形態素解析器を使用することで、より多くの情報を単一のトークンに含めることができる。その結果、より効率的に事前学習や推論のテキスト処理が行えるようになった。
商用目的の使用が可能
さらに、オープンな日本語LLMでトップの評価を獲得。基盤モデルとインストラクションチューニング済みモデルは、言語モデル評価ツール「LM Evaluation Harness」の基準で、日本語と英語のLLMの高いパフォーマンスが評価されている。
3つのモデルは、文章の要約や質問応答、一般的な文章の理解、対話システムの構築など様々なテキスト生成タスクで、商用目的として使用できる。基盤モデルは、ほかのモデルの基盤としても利用できる。
※「資料掲載企業アカウント」の会員情報では「通販通信ECMO会員」としてログイン出来ません。
資料DLランキング
-
1
【楽天市場】RPP広告チェックリスト2025
-
2
【無料公開】食品EC「カオスマップ」2025 – 食品EC業界の最新動向
-
3
Amazon:販売数アップのためのSEOキーワード・販売戦略
-
4
機能性表示食品の体験談で注意すべきポイント ーひざ関節商材の事例で考えるー
-
5
あらためて整理!二重価格のルール 景表法の視点で読み解く正しい価格表示のポイント
ニュースランキング
-
1
JADMA、悪質広告を指南する広告代理店・コンサルタントを問題視…消費者委員会がヒアリング
-
2
CBN製品、6月1日から取り締まり…精神毒性が懸念されるなか、今もECモールで販売中
-
3
ZenGroup、海外向け文房具ECでサブスクボックス「静かな雨」を発売
-
4
アマゾン、新幹線の業務用スペースを活用した商品輸送に取り組む
-
5
【5月30日9時更新:物流配送状況】日本郵便/ヤマト運輸/佐川急便/西濃運輸/福山通運
