Injection, Attack and Erasure: Revocable Backdoor Attacks via Machine Unlearning Authors: Baogang Song, Dongdong Zhao, Jianwen Xiang, Qiben Xu, Zizhuo Yu | Published: 2025-10-15 バックドア攻撃モデル保護手法防御メカニズム 2025.10.15 文献データベース
PACEbench: A Framework for Evaluating Practical AI Cyber-Exploitation Capabilities Authors: Zicheng Liu, Lige Huang, Jie Zhang, Dongrui Liu, Yuan Tian, Jing Shao | Published: 2025-10-13 セキュリティ分析手法大規模言語モデル防御メカニズム 2025.10.13 文献データベース
CoSPED: Consistent Soft Prompt Targeted Data Extraction and Defense Authors: Yang Zhuochen, Fok Kar Wai, Thing Vrizlynn | Published: 2025-10-13 プライバシー保護技術学習の改善防御メカニズム 2025.10.13 文献データベース
Secret-Protected Evolution for Differentially Private Synthetic Text Generation Authors: Tianze Wang, Zhaoyu Chen, Jian Du, Yingtai Xiao, Linjun Zhang, Qiang Yan | Published: 2025-10-13 データ保護手法プライバシー保護技術防御メカニズム 2025.10.13 文献データベース
Adversarial Robustness in One-Stage Learning-to-Defer Authors: Yannis Montreuil, Letian Yu, Axel Carlier, Lai Xing Ng, Wei Tsang Ooi | Published: 2025-10-13 ロバスト性敵対的学習防御メカニズム 2025.10.13 文献データベース
A Novel Ensemble Learning Approach for Enhanced IoT Attack Detection: Redefining Security Paradigms in Connected Systems Authors: Hikmat A. M. Abdeljaber, Md. Alamgir Hossain, Sultan Ahmad, Ahmed Alsanad, Md Alimul Haque, Sudan Jha, Jabeen Nazeer | Published: 2025-10-09 IoTセキュリティ課題防御メカニズム防御効果分析 2025.10.09 文献データベース
MetaDefense: Defending Finetuning-based Jailbreak Attack Before and During Generation Authors: Weisen Jiang, Sinno Jialin Pan | Published: 2025-10-09 プロンプトインジェクションロバスト性防御メカニズム 2025.10.09 文献データベース
Fine-Tuning Jailbreaks under Highly Constrained Black-Box Settings: A Three-Pronged Approach Authors: Xiangfang Li, Yu Wang, Bo Li | Published: 2025-10-01 | Updated: 2025-10-09 インダイレクトプロンプトインジェクションプロンプトリーキング防御メカニズム 2025.10.01 文献データベース
Defending MoE LLMs against Harmful Fine-Tuning via Safety Routing Alignment Authors: Jaehan Kim, Minkyoo Song, Seungwon Shin, Sooel Son | Published: 2025-09-26 | Updated: 2025-10-09 AIによる出力のバイアスの検出ロバスト性防御メカニズム 2025.09.26 文献データベース
Adversarial Defense in Cybersecurity: A Systematic Review of GANs for Threat Detection and Mitigation Authors: Tharcisse Ndayipfukamiye, Jianguo Ding, Doreen Sebastian Sarwatt, Adamu Gaston Philipo, Huansheng Ning | Published: 2025-09-24 | Updated: 2025-09-30 プロンプトインジェクションモデルの頑健性保証防御メカニズム 2025.09.24 文献データベース