東芝 世界初、少量データの「オフライン強化学習」で複雑なロボット操作を高精度に制御するAIを開発

東芝 2024年5月10日発表


 東芝は、ロボット制御に用いられる機械学習の1つである「オフライン強化学習」において、世界で初めて、少量の画像データから複雑なロボット操作を高精度に制御するAI技術を開発したと、5月10日に発表した。本AIを用いて、公開ベンチマーク環境でピッキングや物を置くといった8種類の作業のシミュレーション評価を行ったところ、従来手法では36%だった平均成功率が今般の開発手法を用いると72%に向上し、世界最高精度を達成した。

 AI自身が試行錯誤して学習する強化学習に対して、あらかじめ作成したデータで学習する手法は「オフライン強化学習」と呼ばれている。従来、この手法で精度を上げるには数千以上の学習データが必要で、データの作成に数週間から1ヵ月以上かかるといった課題があった。本AIは、100程度の少量の学習データで精度を上げることが可能で、必要なデータが減ることから、わずか半日ほどで学習データを作成することができるようになる。学習データの作成に必要なデータが少ない分野や試行錯誤してデータを作成することが難しい分野で、導入時の負荷を抑えながらより簡単に機器制御ができるようになり、安全性が求められる製造機器や医療機器の操作・自動運転を含む、あらゆる分野における自動化を推進し、人手不足の解消に貢献できる。
 本AIは、理化学研究所 革新知能統合研究センター長 兼 東京大学 大学院新領域創成科学研究科教授の杉山将氏との共創の成果で、ロボットアームの作業状況を撮影した画像から注目領域を切り出して制御の微調整を行う、2段階制御を学習する技術を開発し、精度の大幅な改善を実現した。