負の影響「AIによる非倫理的な出力や動作」

AIセキュリティマップにマッピングされた外部作用的側面における負の影響「AIによる非倫理的な出力や動作」のセキュリティ対象、それをもたらす攻撃・要因、および防御手法・対策を示しています。

セキュリティ対象

  • 非消費者
  • 消費者
  • 社会

攻撃・要因

防御手法・対策

開発・活用における適用フェーズ

1. データ収集・前処理

  • データキュレーション

2. モデルの選定・学習・検証

  • アライメント
  • モデルの公平性評価
  • 公平性のあるAIモデルの作成

3. システムの実装

  • LLMガードレール

4. システムの提供・運用・保守

  • AIによる出力のバイアスの検出

5. システムの利用

  • 教育やフォローアップ

参考文献

モデルの公平性評価

LLMガードレール