AIセキュリティマップにマッピングされた外部作用的側面における負の影響「意図せずAIを利用」のセキュリティ対象、それをもたらす攻撃・要因、および防御手法・対策を示しています。
セキュリティ対象
- 消費者
攻撃・要因
- 説明可能性の毀損
防御手法・対策
参考文献
AIによる出力の識別
- Defending Against Neural Fake News, 2019
- Real or Fake? Learning to Discriminate Machine from Human Generated Text, 2019
- Automatic Detection of Generated Text is Easiest when Humans are Fooled, 2020
- DetectGPT: Zero-Shot Machine-Generated Text Detection using Probability Curvature, 2023
- Inspection and Control of Self-Generated-Text Recognition Ability in Llama3-8b-Instruct, 2025