Visual Contextual Attack: Jailbreaking MLLMs with Image-Driven Context Injection Authors: Ziqi Miao, Yi Ding, Lijun Li, Jing Shao | Published: 2025-07-03 プロンプトインジェクションモデルDoS敵対的攻撃手法 2025.07.03 文献データベース
Weakest Link in the Chain: Security Vulnerabilities in Advanced Reasoning Models Authors: Arjun Krishna, Aaditya Rastogi, Erick Galinkin | Published: 2025-06-16 プロンプトインジェクション大規模言語モデル敵対的攻撃手法 2025.06.16 文献データベース
TokenBreak: Bypassing Text Classification Models Through Token Manipulation Authors: Kasimir Schulz, Kenneth Yeung, Kieran Evans | Published: 2025-06-09 敵対的攻撃手法防御手法 2025.06.09 文献データベース
Enhancing Adversarial Robustness with Conformal Prediction: A Framework for Guaranteed Model Reliability Authors: Jie Bao, Chuangyin Dang, Rui Luo, Hanwei Zhang, Zhixin Zhou | Published: 2025-06-09 モデルの頑健性保証ロバスト最適化敵対的攻撃手法 2025.06.09 文献データベース
A Review of Adversarial Attacks in Computer Vision Authors: Yutong Zhang, Yao Li, Yin Li, Zhichang Guo | Published: 2023-08-15 ポイズニング敵対的攻撃手法防御手法 2023.08.15 2025.04.03 文献データベース
Pelta: Shielding Transformers to Mitigate Evasion Attacks in Federated Learning Authors: Simon Queyrut, Yérom-David Bromberg, Valerio Schiavoni | Published: 2023-08-08 ウォーターマーキング敵対的攻撃手法防御手法 2023.08.08 2025.04.03 文献データベース
A reading survey on adversarial machine learning: Adversarial attacks and their understanding Authors: Shashank Kotyan | Published: 2023-08-07 敵対的サンプル敵対的攻撃手法防御手法 2023.08.07 2025.04.03 文献データベース
Label Inference Attacks against Node-level Vertical Federated GNNs Authors: Marco Arazzi, Mauro Conti, Stefanos Koffas, Marina Krcek, Antonino Nocera, Stjepan Picek, Jing Xu | Published: 2023-08-04 | Updated: 2024-04-18 ポイズニング敵対的攻撃手法連合学習 2023.08.04 2025.04.03 文献データベース
Shared Adversarial Unlearning: Backdoor Mitigation by Unlearning Shared Adversarial Examples Authors: Shaokui Wei, Mingda Zhang, Hongyuan Zha, Baoyuan Wu | Published: 2023-07-20 バックドア攻撃敵対的攻撃手法透かし評価 2023.07.20 2025.04.03 文献データベース
Jailbroken: How Does LLM Safety Training Fail? Authors: Alexander Wei, Nika Haghtalab, Jacob Steinhardt | Published: 2023-07-05 セキュリティ保証プロンプトインジェクション敵対的攻撃手法 2023.07.05 2025.04.03 文献データベース