東芝デジタルソリューションズとNICT 大規模言語モデルを用いたRAGの品質向上で共同研究を開始

東芝デジタルソリューションズ 2025年4月9日発表


 東芝デジタルソリューションズは、4月1日、国立研究開発法人情報通信研究機構(NICT)と、大規模言語モデル(LLM)を用いた検索拡張生成(RAG)の品質向上に関する共同研究を開始した。

 東芝デジタルソリューションズは、生成AIの事業活用において、LLMのファインチューニング技術やRAGの回答精度を高める技術、AIエージェントの活用技術、工場内データの読み解き技術、ソフトウェア解析技術など様々な応用技術開発を進めている。また、NICTは、これまでに大量の言語データを整備し、日本語に特化したLLMや検索ツールを開発してきた。
 本研究では、NICTの日本語特化型LLMや検索ツールを活用し、より正確で有益な情報を得るための生成AI周辺技術の高度化を目的とする。
 これにより、組織内に蓄積された大量の文書を活用した知識継承や業務効率化の実現を目指す。

 LLMは、事前に学習した膨大なデータに基づいて、様々な公知の専門知識も含めた回答が可能である。しかし、最新の情報や一般には入手できない組織内にしかない情報に基づく回答は困難である。これを補うために、組織内に蓄積される文書等のデータベースから情報を検索し、その情報を基に正確な応答を生成するRAGへの期待が高まっている。RAGを活用した技術の研究開発はまだ発展途上の段階にあり、回答品質を向上させるための取り組みが必要である。
 東芝グループでは、自社の製品・サービスに関わる設計、製造、保守等の長年にわたる膨大なデータを保有している。本研究では、大量の日本語データで学習されたNICTの日本語特化型LLMを活用し、東芝グループが保有するデータを利用して、RAGの高精度化技術を研究開発し、業務効率化や知識継承に活用できる生成AI技術の確立を目指す。

【各社の役割】
東芝デジタルソリューションズ=NICTの言語モデル・ツールを活用した生成AIの回答品質向上に関する研究開発の遂行。
NICT=日本語を中心とした大量の学習用言語データを活用した言語モデル・ツールの提供および強化開発。