Prefix Probing: Lightweight Harmful Content Detection for Large Language Models Authors: Jirui Yang, Hengqi Guo, Zhihui Lu, Yi Zhao, Yuansen Zhang, Shijing Hu, Qiang Duan, Yinggui Wang, Tao Wei | Published: 2025-12-18 トークン分布分析プロンプトインジェクションプロンプトリーキング 2025.12.18 文献データベース
A Systematic Study of Code Obfuscation Against LLM-based Vulnerability Detection Authors: Xiao Li, Yue Li, Hao Wu, Yue Zhang, Yechao Zhang, Fengyuan Xu, Sheng Zhong | Published: 2025-12-18 インダイレクトプロンプトインジェクションプロンプトインジェクション難読化手法 2025.12.18 文献データベース
Quantifying Return on Security Controls in LLM Systems Authors: Richard Helder Moulton, Austin O'Brien, John D. Hastings | Published: 2025-12-17 プロンプトインジェクションリスク分析手法脆弱性検出手法 2025.12.17 文献データベース
PentestEval: Benchmarking LLM-based Penetration Testing with Modular and Stage-Level Design Authors: Ruozhao Yang, Mingfei Cheng, Gelei Deng, Tianwei Zhang, Junjie Wang, Xiaofei Xie | Published: 2025-12-16 インダイレクトプロンプトインジェクションプロンプトインジェクション脆弱性管理 2025.12.16 文献データベース
FlipLLM: Efficient Bit-Flip Attacks on Multimodal LLMs using Reinforcement Learning Authors: Khurram Khalil, Khaza Anuarul Hoque | Published: 2025-12-10 プロンプトインジェクション大規模言語モデル脆弱性評価手法 2025.12.10 文献データベース
Chasing Shadows: Pitfalls in LLM Security Research Authors: Jonathan Evertz, Niklas Risse, Nicolai Neuer, Andreas Müller, Philipp Normann, Gaetano Sapia, Srishti Gupta, David Pape, Soumya Shaw, Devansh Srivastav, Christian Wressnegger, Erwin Quiring, Thorsten Eisenhofer, Daniel Arp, Lea Schönherr | Published: 2025-12-10 データリークやモデルの問題に関する分析を反映した新規ラベルプロンプトインジェクションプロンプトリーキング 2025.12.10 文献データベース
Democratizing ML for Enterprise Security: A Self-Sustained Attack Detection Framework Authors: Sadegh Momeni, Ge Zhang, Birkett Huber, Hamza Harkous, Sam Lipton, Benoit Seguin, Yanis Pavlidis | Published: 2025-12-09 サイバーセキュリティデータ生成の安全性プロンプトインジェクション 2025.12.09 文献データベース
ThinkTrap: Denial-of-Service Attacks against Black-box LLM Services via Infinite Thinking Authors: Yunzhe Li, Jianan Wang, Hongzi Zhu, James Lin, Shan Chang, Minyi Guo | Published: 2025-12-08 DoS対策プロンプトインジェクションモデルDoS 2025.12.08 文献データベース
SoK: a Comprehensive Causality Analysis Framework for Large Language Model Security Authors: Wei Zhao, Zhe Li, Jun Sun | Published: 2025-12-04 プロンプトインジェクション因果推論大規模言語モデル 2025.12.04 文献データベース
In-Context Representation Hijacking Authors: Itay Yona, Amir Sarid, Michael Karasik, Yossi Gandelsman | Published: 2025-12-03 サイバーセキュリティプロンプトインジェクションプロンプトリーキング 2025.12.03 文献データベース