A Geometric Framework for Adversarial Vulnerability in Machine Learning Authors: Brian Bell | Published: 2024-07-03 ポイズニング敵対的サンプル文献リスト 2024.07.03 2025.04.03 文献データベース
Emerging Safety Attack and Defense in Federated Instruction Tuning of Large Language Models Authors: Rui Ye, Jingyi Chai, Xiangrui Liu, Yaodong Yang, Yanfeng Wang, Siheng Chen | Published: 2024-06-15 LLMセキュリティプロンプトインジェクションポイズニング 2024.06.15 2025.04.03 文献データベース
RMF: A Risk Measurement Framework for Machine Learning Models Authors: Jan Schröder, Jakub Breier | Published: 2024-06-15 バックドア攻撃ポイズニングリスク管理 2024.06.15 2025.04.03 文献データベース
Lurking in the shadows: Unveiling Stealthy Backdoor Attacks against Personalized Federated Learning Authors: Xiaoting Lyu, Yufei Han, Wei Wang, Jingkai Liu, Yongsheng Zhu, Guangquan Xu, Jiqiang Liu, Xiangliang Zhang | Published: 2024-06-10 バックドア攻撃ポイズニング 2024.06.10 2025.04.03 文献データベース
A Survey on Machine Unlearning: Techniques and New Emerged Privacy Risks Authors: Hengzhu Liu, Ping Xiong, Tianqing Zhu, Philip S. Yu | Published: 2024-06-10 バックドア攻撃ポイズニングメンバーシップ推論 2024.06.10 2025.04.03 文献データベース
No Vandalism: Privacy-Preserving and Byzantine-Robust Federated Learning Authors: Zhibo Xing, Zijian Zhang, Zi'ang Zhang, Jiamou Liu, Liehuang Zhu, Giovanni Russello | Published: 2024-06-03 ウォーターマーキングバックドア攻撃ポイズニング 2024.06.03 2025.04.03 文献データベース
ACE: A Model Poisoning Attack on Contribution Evaluation Methods in Federated Learning Authors: Zhangchen Xu, Fengqing Jiang, Luyao Niu, Jinyuan Jia, Bo Li, Radha Poovendran | Published: 2024-05-31 | Updated: 2024-06-05 ポイズニング評価手法防御手法 2024.05.31 2025.04.03 文献データベース
PureGen: Universal Data Purification for Train-Time Poison Defense via Generative Model Dynamics Authors: Sunay Bhat, Jeffrey Jiang, Omead Pooladzandi, Alexander Branch, Gregory Pottie | Published: 2024-05-28 | Updated: 2024-06-02 ウォーターマーキングバックドア攻撃ポイズニング 2024.05.28 2025.04.03 文献データベース
Revisit, Extend, and Enhance Hessian-Free Influence Functions Authors: Ziao Yang, Han Yue, Jian Chen, Hongfu Liu | Published: 2024-05-25 | Updated: 2024-10-20 ポイズニングモデル性能評価評価手法 2024.05.25 2025.04.03 文献データベース
BadGD: A unified data-centric framework to identify gradient descent vulnerabilities Authors: Chi-Hua Wang, Guang Cheng | Published: 2024-05-24 バックドア攻撃ポイズニング 2024.05.24 2025.04.03 文献データベース