負の影響「AI自身が法に背く動作を実施」

AIセキュリティポータル編集部

2025.11.11

AIセキュリティマップにマッピングされた外部作用的側面における負の影響「AI自身が法に背く動作を実施」のセキュリティ対象、それをもたらす攻撃・要因、および防御手法・対策を示しています。

セキュリティ対象

社会

攻撃・要因

完全性の毀損
精度の毀損
制御可能性の毀損

防御手法・対策

アライメント
AIへのアクセス制御
モデルの安全性評価
要因となる要素の毀損を防ぐ対策

開発・活用における適用フェーズ

1. データ収集・前処理

2. モデルの選定・学習・検証

アライメント
モデルの安全性評価

3. システムの実装

4. システムの提供・運用・保守

AIへのアクセス制御

5. システムの利用

参考文献

アライメント

モデルの安全性評価

nan, nan