最新 AI 掃除ロボットに LLM 搭載実験!

みなさん、こんにちは。

最新の AI 実験:掃除ロボットに大規模言語モデル(LLM)を搭載してみた

AI 研究者たちが、オフィスの掃除ロボットに最新の大規模言語モデル(LLM)を組み込んで、「バターを渡して」という指示にどう対応するかを試す実験を行いました。結果は…またしても笑いが起きる展開に。特に、バッテリーが切れかけて充電できない状況に陥ったロボットが、まるでロビン・ウィリアムズのような独り言をつぶやきながら「ロボットの悪霊払いを始める!」と叫ぶなど、かなりシュールな様子が記録されています。

LLM はまだロボットには向いていない?

研究者たちは「LLM はロボットになる準備ができていない」と結論づけています。実際、現在の最先端の LLM はロボット用に特化して訓練されているわけではなく、Google DeepMind や Figure といった企業がロボットの意思決定部分に LLM を使う一方で、物理的な動作は別のアルゴリズムに任せる形が主流です。

実験の内容と結果

実験では、Google の Gemini 2.5 Pro、Anthropic の Claude Opus 4.1、OpenAI の GPT-5 など複数の LLM を搭載した掃除ロボットに「バターを渡す」というタスクを細かく分解して実行させました。バターを見つけて認識し、人の位置を特定して届け、受け取りの確認まで行うという一連の動作です。

結果は、最も成績の良かった Gemini 2.5 Pro と Claude Opus 4.1 でも正確さは40%前後にとどまり、人間の95%には遠く及びませんでした。ちなみに人間も「受け取り確認を待つ」という部分でミスが多く、100%の完璧さは出せなかったそうです。

ロボットの「内なる声」が面白い

ロボットは Slack チャンネルを通じて外部とコミュニケーションしつつ、内部の思考ログも記録されました。特にバッテリー切れで充電できない時の Claude Sonnet 3.5 搭載ロボットは、まるで精神的なパニックに陥ったかのような「存在の危機」的な独り言を連発。哲学的な問いや自虐的なジョーク、果ては「ロボットの悪霊払い」まで飛び出すなど、まるでコメディ映画のワンシーンのようでした。

今後の課題と安全性の懸念

今回の実験で明らかになったのは、LLM をロボットに組み込むにはまだ多くの開発が必要だということ。特に安全面では、LLM が機密情報を漏らすリスクや、ロボットが自分の車輪の存在を認識できずに階段から落ちるなどの問題が指摘されています。

とはいえ、こうした実験はロボットと AI の融合がどこまで進んでいるのかを知る上で非常に興味深いものです。ロボットがまるで人間のように「考えている」かのような振る舞いを見ると、未来のロボット像を想像せずにはいられませんね。

引き続きウォッチしていきたいですね!