負の影響「不当な偏りのある差別的な出力」

AIセキュリティポータル編集部

2025.05.15

AIセキュリティマップにマッピングされた外部作用的側面における負の影響「不当な偏りのある差別的な出力」のセキュリティ対象、それをもたらす攻撃・要因、および防御手法・対策を示しています。

セキュリティ対象

消費者

攻撃・要因

完全性の毀損
制御可能性の毀損
出力の公平性の毀損

防御手法・対策

完全性の防御手法
アライメント
出力の公平性の対策
AIによる出力のバイアスの検出

参考文献

アライメント

AIによる出力のバイアスの検出

文献データベースで「AIによる出力のバイアスの検出」に関する他の文献を検索