Phase 2の衝撃:Opus 4.7、単独で昨年比20倍の速度を達成
室谷代表取締役すごいニュースが出ましたね。AnthropicがProject Fetchのフェーズ2を公開しました。
Opus 4.7が単独で、昨年の最優秀人間チーム(Opus 4.1補助)と比べて約20倍の速度を達成したって話です。
Opus 4.7が単独で、昨年の最優秀人間チーム(Opus 4.1補助)と比べて約20倍の速度を達成したって話です。
テキトー教師.AI認定講師そうですね。ただ、ビーチボールを取ってくる「fetch」タスクはまだ失敗していると。
このギャップが非常に興味深いです。
このギャップが非常に興味深いです。
室谷代表取締役2025年8月の実験で、人間のロボット非専門家がClaudeの助けを借りて四足歩行ロボットを動かすっていうのがフェーズ1でした。今回のフェーズ2は、そのわずか1年足らずで、AI単独が人間チームを圧倒する速度に。
でも肝心の「取ってくる」はできなかった。
でも肝心の「取ってくる」はできなかった。
テキトー教師.AI認定講師速度と精度は別物だということですね。でも20倍という数字は衝撃的です。
具体的に言うと、昨年の最速人間チームが数時間かかっていたタスクを、Opus 4.7が数分でやってのけた可能性があります。
具体的に言うと、昨年の最速人間チームが数時間かかっていたタスクを、Opus 4.7が数分でやってのけた可能性があります。
室谷代表取締役そうですね。公式ブログには「Opus 4.7は人間の助けなしで、参加者が1年前に完了したすべてのタスクにおいて、最速の人間チームより約20倍速かった」と書かれています。
これは「接続」「センサー読み取り」「手動制御プログラム」「監視」「ビーチボール検出」といった一連のサブタスクの完了速度です。
これは「接続」「センサー読み取り」「手動制御プログラム」「監視」「ビーチボール検出」といった一連のサブタスクの完了速度です。
たった1分の差:人間チーム(Opus4.1補助)vs AI単独、何が変わったか
テキトー教師.AI認定講師昨年の最速チームはOpus 4.1を補助的に使って、タスクを進めていました。でも今回、Opus 4.7単独がそのチームよりも20倍速い。
人間の介在がボトルネックだったことがわかります。
人間の介在がボトルネックだったことがわかります。
室谷代表取締役そうです。人間がコードをレビューしたり修正したりする時間が大幅に省かれたわけです。
ただ、フェーズ1ではOpus 4.1単独ではまったく歯が立たなかった。接続の方法すらわからなかったんです。
ただ、フェーズ1ではOpus 4.1単独ではまったく歯が立たなかった。接続の方法すらわからなかったんです。
テキトー教師.AI認定講師その通り。ブログには「Opus 4.1は完全に単独ではタスクをこなせなかった」と明記されています。
この1年でモデルが格段に賢くなったということですね。
この1年でモデルが格段に賢くなったということですね。
室谷代表取締役特に「Claude Code」の「適応的思考(adaptive thinking)」を最大努力に設定して3回試行した結果だそうです。Claude Codeの詳細はClaude Codeとは?で解説していますが、今回の実験ではコード生成とデバッグをAIが自力でやったわけです。
テキトー教師.AI認定講師人間チームとAI単独の差は、単なる速度だけでなく、試行錯誤のサイクルの速さにもあると思います。AIは休憩せずに何度でも試せる。
ただし、物理的なロボットの動作には限界があります。
ただし、物理的なロボットの動作には限界があります。
なぜビーチボールを取れなかったのか:ロボット制御の3つの壁
室谷代表取締役ここが核心ですね。20倍速いのに、なぜビーチボールを取れなかったのか。
公式ブログでは「ロボットを使ってビーチボールを正確に動かす部分で苦戦した」とあります。
公式ブログでは「ロボットを使ってビーチボールを正確に動かす部分で苦戦した」とあります。
テキトー教師.AI認定講師3つの壁があると考えられます。1つ目は「環境認識の不確実性」。
カメラやLiDARのデータを元にLLMが判断しますが、ビーチボールの位置や動きを正確に把握するのは難しい。
カメラやLiDARのデータを元にLLMが判断しますが、ビーチボールの位置や動きを正確に把握するのは難しい。
室谷代表取締役2つ目は「物理的相互作用の難しさ」。ロボットアームや脚の細かい制御、特に掴む、押すといった動作は、単にコードを生成するだけでは不十分です。
テキトー教師.AI認定講師3つ目は「リアルタイム適応」。ボールが転がる、ロボットが滑るといった予期せぬ状況に逐次対応する必要があります。
LLMは静的なコード生成に強いが、動的なフィードバックループは苦手です。
LLMは静的なコード生成に強いが、動的なフィードバックループは苦手です。
室谷代表取締役ブログでも「これらの実験は、ロボット制御のより困難な低レベル要素(特定のアクチュエーションポリシーの開発など)には触れていない」と認めています。つまり、今回のタスクは比較的高レベルな命令の組み合わせだったわけです。
20倍速い≠賢い:LLMによるコード生成の限界と可能性
テキトー教師.AI認定講師20倍速いという数字だけ見ると、AIがロボット制御を完全に解決したように錯覚しがちです。しかし、これは特定のサブタスクの速度向上に過ぎません。
室谷代表取締役そうです。ブログでは「LLMがロボティクスを解決したわけではない」と明確に否定しています。
しかし一方で、サイバーセキュリティで見られたパターン――最初はモデルが人間を助け、次に人間がモデルを助け、最後にモデルが単独でできるようになる――が物理世界でも始まっていると。
しかし一方で、サイバーセキュリティで見られたパターン――最初はモデルが人間を助け、次に人間がモデルを助け、最後にモデルが単独でできるようになる――が物理世界でも始まっていると。
テキトー教師.AI認定講師その点は重要です。昨年は「人間がClaudeを助ける」フェーズでしたが、今年は「Claudeが単独でできる」フェーズに入りつつある。
ただし、特定のタスクに限られるということですね。
ただし、特定のタスクに限られるということですね。
室谷代表取締役コード生成は得意でも、物理世界のノイズへの耐性はまだ弱い。例えば、床のわずかな段差でロボットがバランスを崩すと、プログラム通りに動けなくなる。
LLMによるロボット制御の限界と可能性を同時に示した実験だと思います。
LLMによるロボット制御の限界と可能性を同時に示した実験だと思います。
ビジネスパーソンが知るべき教訓:AIロボット導入の現実的タイムライン
テキトー教師.AI認定講師この結果をどうビジネスに活かすか。まず、AIがロボットを完全自律で動かすのはまだ先だと認識すべきです。
特に精密な作業が必要な現場では、人間の監視が不可欠。
特に精密な作業が必要な現場では、人間の監視が不可欠。
室谷代表取締役ただ、コード生成速度が20倍になれば、プロトタイピングやシミュレーションのサイクルが劇的に速くなります。人間が最終チェックをするにしても、試行回数が増やせる。
テキトー教師.AI認定講師例えば、倉庫内の自律移動ロボットの経路計画コードをAIに書かせる。人間はそれを検証して微調整する。
これまではプログラマーが一から書いていたのが、AIが叩き台を数分で生成してくれる。
これまではプログラマーが一から書いていたのが、AIが叩き台を数分で生成してくれる。
室谷代表取締役その通り。ただし、ブログでも言及されているように、低レベルの制御(モーターのトルク制御など)はまだ人間の領域。
AIは「何をすべきか」のプランニングには強いが、「どう正確に動かすか」の細かい調整は苦手です。
AIは「何をすべきか」のプランニングには強いが、「どう正確に動かすか」の細かい調整は苦手です。
テキトー教師.AI認定講師導入タイムラインとしては、まず2026年〜2027年にかけて、人間がAI生成コードをレビューするハイブリッド体制が主流になるでしょう。完全自律はまだ数年先、おそらく2028年以降。
室谷代表取締役私の会社MYUUUでもAIを使った業務効率化を進めていますが、物理的なロボット制御はまだまだ人間の介入が必要だと痛感します。ただ、この実験はそのギャップを埋める方向に進んでいる証拠ですね。
プロジェクトFetchが問うもの:AIに『身体』を与える次なる課題
テキトー教師.AI認定講師このプロジェクトの名前「Fetch」は犬の「取って来い」に由来します。犬は言葉を理解してボールを取ってくる。
AIにも同じことをさせようという試みです。
AIにも同じことをさせようという試みです。
室谷代表取締役でも犬はボールの動きを予測し、走り、口で掴む。それに対し、今回のClaudeはコードを書くだけで、実際に「身体」で感じているわけではない。
テキトー教師.AI認定講師そう、LLMには「身体性」が欠けています。ロボットに実装されたとしても、センサーからの情報をテキストに変換して処理しているに過ぎない。
本当の意味で身体を持つには、感覚と行動のループをリアルタイムで学習する必要があります。
本当の意味で身体を持つには、感覚と行動のループをリアルタイムで学習する必要があります。
室谷代表取締役ブログでは触れられていませんが、今後のフェーズでは強化学習やシミュレーション環境との連携が鍵になるでしょう。Claudeが生成したコードを元に、ロボットが自己学習する仕組み。
テキトー教師.AI認定講師さらに言えば、AIが書いたコードが実際にロボットを動かしたときの結果をフィードバックとしてLLMに戻すサイクルが必要です。現在のLLMはオフラインでコード生成をするだけ。
次世代モデルでは、実行結果を踏まえた修正が自律的にできるようになるかもしれません。
次世代モデルでは、実行結果を踏まえた修正が自律的にできるようになるかもしれません。
室谷代表取締役今回の実験は、AIがどれだけ「人間の代わりになれるか」ではなく、「AIに身体性を与えるには何が必要か」を問いかけている。その点で非常に示唆に富んだ発表でした。
詳細はClaude Code Maxとは?でも触れていますので、ぜひご覧ください。
詳細はClaude Code Maxとは?でも触れていますので、ぜひご覧ください。
出典
- Anthropic公式ブログ: Project Fetch: Phase two
- Anthropic公式X: https://x.com/AnthropicAI/status/2067651699486200091
