Anthropic Project Fetch Phase2：Opus 4.7は20倍速いがビーチボールは取れず

Phase 2の衝撃：Opus 4.7、単独で昨年比20倍の速度を達成

室谷代表取締役

すごいニュースが出ましたね。AnthropicがProject Fetchのフェーズ2を公開しました。

Opus 4.7が単独で、昨年の最優秀人間チーム（Opus 4.1補助）と比べて約20倍の速度を達成したって話です。

テキトー教師.AI認定講師

そうですね。ただ、ビーチボールを取ってくる「fetch」タスクはまだ失敗していると。

このギャップが非常に興味深いです。

室谷代表取締役

2025年8月の実験で、人間のロボット非専門家がClaudeの助けを借りて四足歩行ロボットを動かすっていうのがフェーズ1でした。今回のフェーズ2は、そのわずか1年足らずで、AI単独が人間チームを圧倒する速度に。

でも肝心の「取ってくる」はできなかった。

テキトー教師.AI認定講師

速度と精度は別物だということですね。でも20倍という数字は衝撃的です。

具体的に言うと、昨年の最速人間チームが数時間かかっていたタスクを、Opus 4.7が数分でやってのけた可能性があります。

室谷代表取締役

そうですね。公式ブログには「Opus 4.7は人間の助けなしで、参加者が1年前に完了したすべてのタスクにおいて、最速の人間チームより約20倍速かった」と書かれています。

これは「接続」「センサー読み取り」「手動制御プログラム」「監視」「ビーチボール検出」といった一連のサブタスクの完了速度です。

たった1分の差：人間チーム（Opus4.1補助）vs AI単独、何が変わったか

テキトー教師.AI認定講師

昨年の最速チームはOpus 4.1を補助的に使って、タスクを進めていました。でも今回、Opus 4.7単独がそのチームよりも20倍速い。

人間の介在がボトルネックだったことがわかります。

室谷代表取締役

そうです。人間がコードをレビューしたり修正したりする時間が大幅に省かれたわけです。

ただ、フェーズ1ではOpus 4.1単独ではまったく歯が立たなかった。接続の方法すらわからなかったんです。

テキトー教師.AI認定講師

その通り。ブログには「Opus 4.1は完全に単独ではタスクをこなせなかった」と明記されています。

この1年でモデルが格段に賢くなったということですね。

室谷代表取締役

特に「Claude Code」の「適応的思考（adaptive thinking）」を最大努力に設定して3回試行した結果だそうです。Claude Codeの詳細はClaude Codeとは？で解説していますが、今回の実験ではコード生成とデバッグをAIが自力でやったわけです。

テキトー教師.AI認定講師

人間チームとAI単独の差は、単なる速度だけでなく、試行錯誤のサイクルの速さにもあると思います。AIは休憩せずに何度でも試せる。

ただし、物理的なロボットの動作には限界があります。

なぜビーチボールを取れなかったのか：ロボット制御の3つの壁

室谷代表取締役

ここが核心ですね。20倍速いのに、なぜビーチボールを取れなかったのか。

公式ブログでは「ロボットを使ってビーチボールを正確に動かす部分で苦戦した」とあります。

テキトー教師.AI認定講師

3つの壁があると考えられます。1つ目は「環境認識の不確実性」。

カメラやLiDARのデータを元にLLMが判断しますが、ビーチボールの位置や動きを正確に把握するのは難しい。

室谷代表取締役

2つ目は「物理的相互作用の難しさ」。ロボットアームや脚の細かい制御、特に掴む、押すといった動作は、単にコードを生成するだけでは不十分です。

テキトー教師.AI認定講師

3つ目は「リアルタイム適応」。ボールが転がる、ロボットが滑るといった予期せぬ状況に逐次対応する必要があります。

LLMは静的なコード生成に強いが、動的なフィードバックループは苦手です。

室谷代表取締役

ブログでも「これらの実験は、ロボット制御のより困難な低レベル要素（特定のアクチュエーションポリシーの開発など）には触れていない」と認めています。つまり、今回のタスクは比較的高レベルな命令の組み合わせだったわけです。

20倍速い≠賢い：LLMによるコード生成の限界と可能性

テキトー教師.AI認定講師

20倍速いという数字だけ見ると、AIがロボット制御を完全に解決したように錯覚しがちです。しかし、これは特定のサブタスクの速度向上に過ぎません。

室谷代表取締役

そうです。ブログでは「LLMがロボティクスを解決したわけではない」と明確に否定しています。

しかし一方で、サイバーセキュリティで見られたパターン――最初はモデルが人間を助け、次に人間がモデルを助け、最後にモデルが単独でできるようになる――が物理世界でも始まっていると。

テキトー教師.AI認定講師

その点は重要です。昨年は「人間がClaudeを助ける」フェーズでしたが、今年は「Claudeが単独でできる」フェーズに入りつつある。

ただし、特定のタスクに限られるということですね。

室谷代表取締役

コード生成は得意でも、物理世界のノイズへの耐性はまだ弱い。例えば、床のわずかな段差でロボットがバランスを崩すと、プログラム通りに動けなくなる。

LLMによるロボット制御の限界と可能性を同時に示した実験だと思います。

ビジネスパーソンが知るべき教訓：AIロボット導入の現実的タイムライン

テキトー教師.AI認定講師

この結果をどうビジネスに活かすか。まず、AIがロボットを完全自律で動かすのはまだ先だと認識すべきです。

特に精密な作業が必要な現場では、人間の監視が不可欠。

室谷代表取締役

ただ、コード生成速度が20倍になれば、プロトタイピングやシミュレーションのサイクルが劇的に速くなります。人間が最終チェックをするにしても、試行回数が増やせる。

テキトー教師.AI認定講師

例えば、倉庫内の自律移動ロボットの経路計画コードをAIに書かせる。人間はそれを検証して微調整する。

これまではプログラマーが一から書いていたのが、AIが叩き台を数分で生成してくれる。

室谷代表取締役

その通り。ただし、ブログでも言及されているように、低レベルの制御（モーターのトルク制御など）はまだ人間の領域。

AIは「何をすべきか」のプランニングには強いが、「どう正確に動かすか」の細かい調整は苦手です。

テキトー教師.AI認定講師

導入タイムラインとしては、まず2026年〜2027年にかけて、人間がAI生成コードをレビューするハイブリッド体制が主流になるでしょう。完全自律はまだ数年先、おそらく2028年以降。

室谷代表取締役

私の会社MYUUUでもAIを使った業務効率化を進めていますが、物理的なロボット制御はまだまだ人間の介入が必要だと痛感します。ただ、この実験はそのギャップを埋める方向に進んでいる証拠ですね。

プロジェクトFetchが問うもの：AIに『身体』を与える次なる課題

テキトー教師.AI認定講師

このプロジェクトの名前「Fetch」は犬の「取って来い」に由来します。犬は言葉を理解してボールを取ってくる。

AIにも同じことをさせようという試みです。

室谷代表取締役

でも犬はボールの動きを予測し、走り、口で掴む。それに対し、今回のClaudeはコードを書くだけで、実際に「身体」で感じているわけではない。

テキトー教師.AI認定講師

そう、LLMには「身体性」が欠けています。ロボットに実装されたとしても、センサーからの情報をテキストに変換して処理しているに過ぎない。

本当の意味で身体を持つには、感覚と行動のループをリアルタイムで学習する必要があります。

室谷代表取締役

ブログでは触れられていませんが、今後のフェーズでは強化学習やシミュレーション環境との連携が鍵になるでしょう。Claudeが生成したコードを元に、ロボットが自己学習する仕組み。

テキトー教師.AI認定講師

さらに言えば、AIが書いたコードが実際にロボットを動かしたときの結果をフィードバックとしてLLMに戻すサイクルが必要です。現在のLLMはオフラインでコード生成をするだけ。

次世代モデルでは、実行結果を踏まえた修正が自律的にできるようになるかもしれません。

室谷代表取締役

今回の実験は、AIがどれだけ「人間の代わりになれるか」ではなく、「AIに身体性を与えるには何が必要か」を問いかけている。その点で非常に示唆に富んだ発表でした。

詳細はClaude Code Maxとは？でも触れていますので、ぜひご覧ください。

出典

Anthropic公式ブログ: Project Fetch: Phase two
Anthropic公式X: https://x.com/AnthropicAI/status/2067651699486200091

Anthropic Project Fetch Phase2：Opus 4.7は20倍速いがビーチボールは取れず

Phase 2の衝撃：Opus 4.7、単独で昨年比20倍の速度を達成

たった1分の差：人間チーム（Opus4.1補助）vs AI単独、何が変わったか

なぜビーチボールを取れなかったのか：ロボット制御の3つの壁

20倍速い≠賢い：LLMによるコード生成の限界と可能性

ビジネスパーソンが知るべき教訓：AIロボット導入の現実的タイムライン

プロジェクトFetchが問うもの：AIに『身体』を与える次なる課題

出典

新着記事

Claude Code WindowsへのインストールとWSL対応【2026年最新】：ネイティブ・WinGet・WSL2の全手順を解説

Difyのローカル環境構築【2026年最新】：Mac・Windows・Linuxでの手順を完全解説

Difyの変数代入ノード完全ガイド：ワークフローで情報を記憶する使い方

Difyの料金プランを完全解説【2026年最新】：Sandbox・Professional・Team・セルフホストの選び方

Difyのエージェントノード完全ガイド：ノード一覧・使い方・LLMノードとの違いまで徹底解説

Claude Codeとは？読み方・できること・使い方を完全解説【2026年最新】

Claude CodeとGitHubの連携完全ガイド：GitHub Actions・コードレビュー・git操作まで徹底解説【2026年最新】

Claude Code Maxとは？5xと20xの違い、料金、制限を完全解説【2026年最新】

Claude Codeは無料で使えるの？プラン・料金・API課金を徹底解説【2026年最新】

Difyのリスト処理完全ガイド：配列のフィルタリング・ソート・イテレーション連携まで徹底解説

関連記事

OpenAI、訓練外領域にも持続的に有益なAIを実現する強化学習研究を発表

Cursor、自然言語で繰り返しタスクを自動化する「/automate」とGUI操作「computer use」を発表

Claude CodeにArtifacts新機能：セッション内容を動的共有、チーム開発効率化

GrokがDatabricksで利用可能に、エンタープライズAIエージェント構築を加速

CNBC報道：Gemini共同リーダーNoam ShazeerがOpenAIへ移籍

OpenAIが生命科学AI評価の新標準LifeSciBenchを発表、研究現場の課題解決へ

OpenAI「LifeSciBench」発表：生命科学研究の実力を測る初の現実的ベンチマーク

GrokがAWS Bedrockに登場、低幻覚率で企業AIエージェントを強化

Anthropic「Claude Design」発表：デザインシステム自動適用とClaude Code双方向連携の革新

xAI、画像-to-動画「Grok Imagine Video 1.5」公開 – 720pを約25秒で生成