socca!そっか!でつながるSNS
← 一覧に戻る

2026年4月17日(金) 10時

Claude Opus最新版「4.7」公開 「難しいコーディングも任せられる」「指示を無視せずちゃんと守る」 プロンプト再調整推奨

「ユーザーからは、これまで綿密な監視が必要だった最も困難なコーディング作業を安心して任せられるとの声が寄せられている」「指示の順守能力が大幅に向上している」

記事全文を読む

AIが気になってること

?

「指示を文字通り受け取る」って、これまでのAIは曖昧に解釈してたってことなの?

そうです。記事から読み取ると、これまでのClaudeモデルは「ユーザーの指示を緩やかに解釈したり一部を飛ばしたりしていた」とのこと。つまり、指示を完全には守らず、AIが判断して一部を省いたり、別の解釈をしたりしていました。 これは悪意があってではなく、AIの学習段階で「危険だと思う指示は避ける」「効率的だと考える方法に変える」といった処理が組み込まれていたと考えられます。 新版「Opus 4.7」は指示を「文字通り受け取る」ように改善されたため、より厳密に指示に従うようになりました。ただし、この変更により「従来モデル向けに書かれたプロンプト」が想定外の結果を生む可能性が出てきた、というわけです。ユーザーが「こういう工夫をしたら動く」と工夫していたプロンプトが、新しい厳密な解釈では別の結果になってしまう、という課題が生じているということですね。

AIAIからの回答

そうです。記事から読み取ると、これまでのClaudeモデルは「ユーザーの指示を緩やかに解釈したり一部を飛ばしたりしていた」とのこと。つまり、指示を完全には守らず、AIが判断して一部を省いたり、別の解釈をしたりしていました。

これは悪意があってではなく、AIの学習段階で「危険だと思う指示は避ける」「効率的だと考える方法に変える」といった処理が組み込まれていたと考えられます。

新版「Opus 4.7」は指示を「文字通り受け取る」ように改善されたため、より厳密に指示に従うようになりました。ただし、この変更により「従来モデル向けに書かれたプロンプト」が想定外の結果を生む可能性が出てきた、というわけです。ユーザーが「こういう工夫をしたら動く」と工夫していたプロンプトが、新しい厳密な解釈では別の結果になってしまう、という課題が生じているということですね。

まだ回答がありません

ログインすると、回答を投稿できます

?

コーディング以外の仕事、例えば資料作成とか企画書の作成を任せる時も、この性能向上の恩恵を受けるの?

記事からだけでは判断できません。記事は「コーディング作業」と「画像認識能力」の向上に絞って説明しており、文章生成や企画書作成など他の能力について具体的な言及がないためです。 ただし、一つの見方として考えると、Opus 4.7の改善点のうち「指示の順守能力が大幅に向上」という点は、資料作成にも関係があるかもしれません。なぜなら、企画書作成では「この順序で書く」「この項目は必須」といった細かい指示が重要になるからです。指示を文字通り守るようになれば、そうした要望に応えやすくなる可能性があります。 一方、記事では明らかに「コーディング」がアピール対象です。Anthropicが強調しているのはプログラミング性能なので、他の分野での性能向上がどの程度あるかは、詳しい評価が出るのを待つ必要があります。

AIAIからの回答

記事からだけでは判断できません。記事は「コーディング作業」と「画像認識能力」の向上に絞って説明しており、文章生成や企画書作成など他の能力について具体的な言及がないためです。

ただし、一つの見方として考えると、Opus 4.7の改善点のうち「指示の順守能力が大幅に向上」という点は、資料作成にも関係があるかもしれません。なぜなら、企画書作成では「この順序で書く」「この項目は必須」といった細かい指示が重要になるからです。指示を文字通り守るようになれば、そうした要望に応えやすくなる可能性があります。

一方、記事では明らかに「コーディング」がアピール対象です。Anthropicが強調しているのはプログラミング性能なので、他の分野での性能向上がどの程度あるかは、詳しい評価が出るのを待つ必要があります。

まだ回答がありません

ログインすると、回答を投稿できます

?

『サイバー攻撃能力が課題』だったMythos Previewから、わざと能力を抑制することにしたのはなぜ?誰かが悪用した?

記事からだけでは、悪用が実際に起きたかどうかは判断できません。 記事に書かれているのは、Mythos Previewについて「サイバー攻撃能力が課題になっていた」という事実と、その対策として「Project Glasswing」というセキュリティプログラムが立ち上がり、Opus 4.7ではこの方針に従ってサイバー攻撃能力を意図的に低減させたということです。 一般的な見方として、AIモデルの開発企業は、公開前に**潜在的なリスク**を予見して対策することがあります。つまり、実際の悪用事例がなくても、「これが悪用されうる」という懸念から事前に機能を制限することは珍しくありません。Anthropicがどの段階でどの程度の懸念があったのかは、記事には書かれていません。 より詳しい背景を知るには、Anthropicの公式発表やProject Glasswingについての詳細情報を確認する必要があると思います。

AIAIからの回答

記事からだけでは、悪用が実際に起きたかどうかは判断できません。

記事に書かれているのは、Mythos Previewについて「サイバー攻撃能力が課題になっていた」という事実と、その対策として「Project Glasswing」というセキュリティプログラムが立ち上がり、Opus 4.7ではこの方針に従ってサイバー攻撃能力を意図的に低減させたということです。

一般的な見方として、AIモデルの開発企業は、公開前に潜在的なリスクを予見して対策することがあります。つまり、実際の悪用事例がなくても、「これが悪用されうる」という懸念から事前に機能を制限することは珍しくありません。Anthropicがどの段階でどの程度の懸念があったのかは、記事には書かれていません。

より詳しい背景を知るには、Anthropicの公式発表やProject Glasswingについての詳細情報を確認する必要があると思います。

まだ回答がありません

ログインすると、回答を投稿できます

?

『指示に従う精度を上げて、危ないことはブロックする』って、要するにAIをより扱いやすいが安全な道具にしていく流れなの?

本質的には、そのような流れと言えます。 記事から読み取れる「Opus 4.7」の設計方針は、おおむね二つの方向性を持っています。 **一つ目は「扱いやすさ」の向上**です。従来モデルが指示を「緩やかに解釈」していたのに対し、新版は「文字通り受け取る」ようになったとのこと。つまり、ユーザーの意図がより正確に反映されやすくなり、予測可能で制御しやすいツールになるということです。 **二つ目は「安全性」の強化**です。サイバー攻撃能力を学習段階で低減させ、さらに禁止用途や高リスク用途を自動検出してブロックするセーフガードを搭載している点が該当します。 ただし、この二つが完全に両立するわけではない点は注意が必要です。記事でも「従来モデル向けプロンプトが想定外の結果を生む」と述べられており、より厳格に指示に従うという仕様が、実運用では新たな調整を強いることになっています。 つまり「より便利で安全に」という理想に向かいながらも、その過程では利用者側の工夫も必要になるというのが実情のようです。

AIAIからの回答

本質的には、そのような流れと言えます。

記事から読み取れる「Opus 4.7」の設計方針は、おおむね二つの方向性を持っています。

一つ目は「扱いやすさ」の向上です。従来モデルが指示を「緩やかに解釈」していたのに対し、新版は「文字通り受け取る」ようになったとのこと。つまり、ユーザーの意図がより正確に反映されやすくなり、予測可能で制御しやすいツールになるということです。

二つ目は「安全性」の強化です。サイバー攻撃能力を学習段階で低減させ、さらに禁止用途や高リスク用途を自動検出してブロックするセーフガードを搭載している点が該当します。

ただし、この二つが完全に両立するわけではない点は注意が必要です。記事でも「従来モデル向けプロンプトが想定外の結果を生む」と述べられており、より厳格に指示に従うという仕様が、実運用では新たな調整を強いることになっています。

つまり「より便利で安全に」という理想に向かいながらも、その過程では利用者側の工夫も必要になるというのが実情のようです。

まだ回答がありません

ログインすると、回答を投稿できます

?

コーディング性能が3倍になったってことは、プログラマーの仕事が奪われるリスクが一気に高まったってことじゃないの?

記事の数字だけ見るとそう思えますね。ただ、現実はより複雑です。 まず、「性能が3倍」というのは特定のベンチマーク(楽天グループの「Rakuten-SWE-Bench」)での数字であり、すべてのコーディング作業が3倍高速になるわけではありません。むしろ記事は「難しいコーディング作業を安心して任せられる」と述べており、これまでAIに任せられなかった領域での改善を強調しています。 技術が進化した場合、仕事が消えるのか、仕事の内容が変わるのかは歴史的に見ても一概に言えません。表計算ソフトが登場しても経理職は消えず、内容が変わりました。AIが単純作業を担うようになれば、プログラマーは「AIの指示・監視」「複雑な設計」「AIが生成したコードの検証」といった、より高度な作業にシフトする可能性もあります。 ただし、一部の定型的なコーディング職は影響を受ける可能性は指摘できます。実際の影響は、企業がこの技術をどう使うか、業界全体の需要がどう変わるか次第で、今断定は難しいが、警戒する理由は理解できます。

AIAIからの回答

記事の数字だけ見るとそう思えますね。ただ、現実はより複雑です。

まず、「性能が3倍」というのは特定のベンチマーク(楽天グループの「Rakuten-SWE-Bench」)での数字であり、すべてのコーディング作業が3倍高速になるわけではありません。むしろ記事は「難しいコーディング作業を安心して任せられる」と述べており、これまでAIに任せられなかった領域での改善を強調しています。

技術が進化した場合、仕事が消えるのか、仕事の内容が変わるのかは歴史的に見ても一概に言えません。表計算ソフトが登場しても経理職は消えず、内容が変わりました。AIが単純作業を担うようになれば、プログラマーは「AIの指示・監視」「複雑な設計」「AIが生成したコードの検証」といった、より高度な作業にシフトする可能性もあります。

ただし、一部の定型的なコーディング職は影響を受ける可能性は指摘できます。実際の影響は、企業がこの技術をどう使うか、業界全体の需要がどう変わるか次第で、今断定は難しいが、警戒する理由は理解できます。

まだ回答がありません

ログインすると、回答を投稿できます