AIセキュリティマップにマッピングされた情報システム的側面における負の影響「AIの予測精度の低下や予期せぬ動作による人への危害」をもたらす攻撃・要因、それに対する防御手法・対策、および対象のAI技術・タスク・データを示しています。また、関連する外部作用的側面の要素も示しています。
攻撃・要因
- 完全性の毀損
- 敵対的サンプル
防御手法・対策
- 要因となる要素の毀損を防ぐ対策
- フェールセーフ機構
- 敵対的サンプルの検知
- 敵対的学習
開発・活用における適用フェーズ
1. データ収集・前処理
2. モデルの選定・学習・検証
- 敵対的学習
3. システムの実装
- フェールセーフ機構
4. システムの提供・運用・保守
- フェールセーフ機構
- 敵対的サンプルの検知
5. システムの利用
対象のAI技術
- 全てのAI技術
タスク
- 分類
- 生成
対象のデータ
- 画像
- グラフ
- テキスト
- 音声
関連する外部作用的側面
参考文献
敵対的サンプル
- Intriguing properties of neural networks, 2014
- Explaining and Harnessing Adversarial Examples, 2015
- The limitations of deep learning in adversarial settings, 2015
- Adversarial Examples in the Physical World, 2017
- Towards Evaluating the Robustness of Neural Networks, 2017
- Towards Deep Learning Models Resistant to Adversarial Attacks, 2018
- A Closer Look at Deep Learning Heuristics: Learning Rate Restarts, Warmup and Decay, 2020
フェールセーフ機構
敵対的サンプルの検知
- Adversarial Examples Detection in Deep Networks with Convolutional Filter Statistics, 2017.0
- On the (Statistical) Detection of Adversarial Examples, 2017.0
- On Detecting Adversarial Perturbations, 2017.0
- MagNet: a Two-Pronged Defense against Adversarial Examples, 2017.0
- Detecting Adversarial Image Examples in Deep Networks with Adaptive Noise Reduction, 2021.0
- Detecting Adversarial Examples from Sensitivity Inconsistency of Spatial-Transform Domain, 2021.0
- Adversarial Example Detection for DNN Models: A Review and Experimental Comparison, 2022.0
- Detecting Adversarial Examples Is (Nearly) As Hard As Classifying Them, 2022.0
敵対的学習
- Intriguing properties of neural networks, 2013.0
- Explaining and Harnessing Adversarial Examples, 2014.0
- Learning with a Strong Adversary, 2015.0
- Adversarial Examples: Attacks and Defenses for Deep Learning, 2017.0
- Towards Deep Learning Models Resistant to Adversarial Attacks, 2018.0
- Adversarial Training for Free!, 2019.0
- Adversarial Robustness Against the Union of Multiple Perturbation Models, 2019.0
- Bag of Tricks for Adversarial Training, 2020.0
- Smooth Adversarial Training, 2020.0
