セキュリティ
AIモデル「蒸留攻撃」を検出・防止 — DeepSeek等による大規模不正利用を発覚
2026-02-23
Anthropicは2026年2月23日、DeepSeek・Moonshot・MiniMaxの3つのAI研究所が産業規模の不正「蒸留攻撃」を行っていたことを発見したと発表しました。
🔍 何が起きたか
これら3社は約2.4万件の偽アカウントを通じて1600万件以上のやり取りを生成。利用規約と地域アクセス制限に違反し、Claudeの能力を不正に蒸留して自社モデルを強化しようとしました。
⚠️ 蒸留攻撃の危険性
- 安全対策の喪失:不正蒸留モデルは生物兵器・サイバー攻撃への悪用防止機能を引き継がない可能性がある
- 国家安全保障リスク:外国の軍・情報機関・監視システムへの強力なAI能力流出
- オープンソース化による拡散:一度オープンソース化されると制御不能になるリスク
🛡️ 今後の対応
Anthropicは業界・政策立案者・国際AIコミュニティとの迅速な協調対応を呼びかけています。合法的な蒸留(自社モデルの小型化など)は引き続き認められますが、競合他社による不正蒸留には断固対処する方針です。
🔗 詳細は Anthropic公式サイト をご覧ください。