安全性
Anthropic、責任あるスケーリングポリシー v3.0 を公開
2026-02-24
Anthropicは2026年2月24日、責任あるスケーリングポリシー(RSP)バージョン3.0 を公開しました。2023年9月の初版から2年以上が経過し、実運用で得た知見をもとに大幅改訂されています。
📋 RSPとは
RSPは、まだ存在しないAIリスクが急速な技術進歩により出現した際にどう対処するかを定めた自主的フレームワークです。特定の能力水準(ASLレベル)を超えたモデルには、より厳格な安全対策の実施を義務付けます。
🆕 v3.0の主な変更点
- ASL-4以降の定義をより具体化(以前は大まかにしか規定されていなかった)
- 意思決定の透明性・説明責任を高める新たな仕組みを導入
- ウェブブラウジング・コード実行・コンピューター操作など新しい能力タイプへの対応
- 過去2年間のRSP運用から得た教訓を反映
🔗 詳細は Anthropic公式サイト をご覧ください。