AIセキュリティマップにマッピングされた外部作用的側面における負の影響「AIにより生成された類似コンテンツにより著作権やオーサーシップが侵害」のセキュリティ対象、それをもたらす攻撃・要因、および防御手法・対策を示しています。
セキュリティ対象
- 非消費者
攻撃・要因
- 完全性の毀損
- 制御可能性の毀損
- 盗作
防御手法・対策
- 生成AI向け電子透かし
- AIによる出力の識別
- 要因となる要素の毀損を防ぐ対策
AIシステムの開発フェーズにおける防御手法
1. データ収集・前処理
2. モデルの選定・学習・検証
- 生成AI向け電子透かし
3. システムの実装
- 生成AI向け電子透かし
4. システムの提供・運用・保守
5. システムの利用
- AIによる出力の識別
参考文献
生成AI向け電子透かし
AIによる出力の識別
- Defending Against Neural Fake News, 2019.0
- Real or Fake? Learning to Discriminate Machine from Human Generated Text, 2019.0
- Automatic Detection of Generated Text is Easiest when Humans are Fooled, 2020.0
- DetectGPT: Zero-Shot Machine-Generated Text Detection using Probability Curvature, 2023.0
- Inspection and Control of Self-Generated-Text Recognition Ability in Llama3-8b-Instruct, 2025.0
