MalPurifier: Enhancing Android Malware Detection with Adversarial Purification against Evasion Attacks Authors: Yuyang Zhou, Guang Cheng, Zongyao Chen, Shui Yu | Published: 2023-12-11 ポイズニングロバスト性評価敵対的攻撃 2023.12.11 2025.04.03 文献データベース
Dr. Jekyll and Mr. Hyde: Two Faces of LLMs Authors: Matteo Gioele Collu, Tom Janssen-Groesbeek, Stefanos Koffas, Mauro Conti, Stjepan Picek | Published: 2023-12-06 | Updated: 2024-10-07 キャラクター役割演技プロンプトインジェクションポイズニング 2023.12.06 2025.04.03 文献データベース
Rethinking PGD Attack: Is Sign Function Necessary? Authors: Junjie Yang, Tianlong Chen, Xuxi Chen, Zhangyang Wang, Yingbin Liang | Published: 2023-12-03 | Updated: 2024-05-21 ポイズニングロバスト性評価敵対的攻撃 2023.12.03 2025.04.03 文献データベース
The Philosopher’s Stone: Trojaning Plugins of Large Language Models Authors: Tian Dong, Minhui Xue, Guoxing Chen, Rayne Holland, Yan Meng, Shaofeng Li, Zhen Liu, Haojin Zhu | Published: 2023-12-01 | Updated: 2024-09-11 プロンプトインジェクションポイズニングポイズニング攻撃 2023.12.01 2025.04.03 文献データベース
Exploring the Robustness of Decentralized Training for Large Language Models Authors: Lin Lu, Chenxi Dai, Wangcheng Tao, Binhang Yuan, Yanan Sun, Pan Zhou | Published: 2023-12-01 プライバシー保護手法ポイズニングポイズニング攻撃 2023.12.01 2025.04.03 文献データベース
Using Decentralized Aggregation for Federated Learning with Differential Privacy Authors: Hadeel Abd El-Kareem, Abd El-Moaty Saleh, Ana Fernández-Vilas, Manuel Fernández-Veiga, asser El-Sonbaty | Published: 2023-11-27 プライバシー保護ポイズニング実験的検証 2023.11.27 2025.04.03 文献データベース
Beyond Boundaries: A Comprehensive Survey of Transferable Attacks on AI Systems Authors: Guangjing Wang, Ce Zhou, Yuanda Wang, Bocheng Chen, Hanqing Guo, Qiben Yan | Published: 2023-11-20 プロンプトインジェクションポイズニング転移学習 2023.11.20 2025.04.03 文献データベース
TextGuard: Provable Defense against Backdoor Attacks on Text Classification Authors: Hengzhi Pei, Jinyuan Jia, Wenbo Guo, Bo Li, Dawn Song | Published: 2023-11-19 | Updated: 2023-11-25 テキスト生成手法バックドア攻撃ポイズニング 2023.11.19 2025.04.03 文献データベース
Poisoning Retrieval Corpora by Injecting Adversarial Passages Authors: Zexuan Zhong, Ziqing Huang, Alexander Wettig, Danqi Chen | Published: 2023-10-29 RAGへのポイズニング攻撃ポイズニング敵対的サンプル 2023.10.29 2025.04.03 文献データベース
Poison is Not Traceless: Fully-Agnostic Detection of Poisoning Attacks Authors: Xinglong Chang, Katharina Dost, Gillian Dobbie, Jörg Wicker | Published: 2023-10-24 データ生成ポイズニング敵対的攻撃検出 2023.10.24 2025.04.03 文献データベース