AegisAgent: An Autonomous Defense Agent Against Prompt Injection Attacks in LLM-HARs Authors: Yihan Wang, Huanqi Yang, Shantanu Pal, Weitao Xu | Published: 2025-12-24 インダイレクトプロンプトインジェクションプロンプトインジェクション敵対的攻撃評価 2025.12.24 文献データベース
Odysseus: Jailbreaking Commercial Multimodal LLM-integrated Systems via Dual Steganography Authors: Songze Li, Jiameng Cheng, Yiming Li, Xiaojun Jia, Dacheng Tao | Published: 2025-12-23 LLMの安全機構の解除プロンプトインジェクションマルチモーダル安全性 2025.12.23 文献データベース
On the Effectiveness of Instruction-Tuning Local LLMs for Identifying Software Vulnerabilities Authors: Sangryu Park, Gihyuk Ko, Homook Cho | Published: 2025-12-23 プロンプトインジェクション大規模言語モデル脆弱性分析 2025.12.23 文献データベース
GShield: Mitigating Poisoning Attacks in Federated Learning Authors: Sameera K. M., Serena Nicolazzo, Antonino Nocera, Vinod P., Rafidha Rehiman K. A | Published: 2025-12-22 データ毒性攻撃プロンプトインジェクションポイズニング 2025.12.22 文献データベース
Efficient Jailbreak Mitigation Using Semantic Linear Classification in a Multi-Staged Pipeline Authors: Akshaj Prashanth Rao, Advait Singh, Saumya Kumaar Saksena, Dhruv Kumar | Published: 2025-12-22 プロンプトインジェクション透かし防御メカニズム 2025.12.22 文献データベース
Prefix Probing: Lightweight Harmful Content Detection for Large Language Models Authors: Jirui Yang, Hengqi Guo, Zhihui Lu, Yi Zhao, Yuansen Zhang, Shijing Hu, Qiang Duan, Yinggui Wang, Tao Wei | Published: 2025-12-18 トークン分布分析プロンプトインジェクションプロンプトリーキング 2025.12.18 文献データベース
A Systematic Study of Code Obfuscation Against LLM-based Vulnerability Detection Authors: Xiao Li, Yue Li, Hao Wu, Yue Zhang, Yechao Zhang, Fengyuan Xu, Sheng Zhong | Published: 2025-12-18 インダイレクトプロンプトインジェクションプロンプトインジェクション難読化手法 2025.12.18 文献データベース
Quantifying Return on Security Controls in LLM Systems Authors: Richard Helder Moulton, Austin O'Brien, John D. Hastings | Published: 2025-12-17 プロンプトインジェクションリスク分析手法脆弱性検出手法 2025.12.17 文献データベース
PentestEval: Benchmarking LLM-based Penetration Testing with Modular and Stage-Level Design Authors: Ruozhao Yang, Mingfei Cheng, Gelei Deng, Tianwei Zhang, Junjie Wang, Xiaofei Xie | Published: 2025-12-16 インダイレクトプロンプトインジェクションプロンプトインジェクション脆弱性管理 2025.12.16 文献データベース
FlipLLM: Efficient Bit-Flip Attacks on Multimodal LLMs using Reinforcement Learning Authors: Khurram Khalil, Khaza Anuarul Hoque | Published: 2025-12-10 プロンプトインジェクション大規模言語モデル脆弱性評価手法 2025.12.10 文献データベース