Fewer Weights, More Problems: A Practical Attack on LLM Pruning Authors: Kazuki Egashira, Robin Staab, Thibaud Gloaguen, Mark Vero, Martin Vechev | Published: 2025-10-09 セキュリティ分析手法プロンプトインジェクション防御効果分析 2025.10.09 文献データベース
MetaDefense: Defending Finetuning-based Jailbreak Attack Before and During Generation Authors: Weisen Jiang, Sinno Jialin Pan | Published: 2025-10-09 プロンプトインジェクションロバスト性防御メカニズム 2025.10.09 文献データベース
Proactive defense against LLM Jailbreak Authors: Weiliang Zhao, Jinjun Peng, Daniel Ben-Levi, Zhou Yu, Junfeng Yang | Published: 2025-10-06 LLMの安全機構の解除プロンプトインジェクション防御手法の統合 2025.10.06 文献データベース
P2P: A Poison-to-Poison Remedy for Reliable Backdoor Defense in LLMs Authors: Shuai Zhao, Xinyi Wu, Shiqian Zhao, Xiaobao Wu, Zhongliang Guo, Yanhao Jia, Anh Tuan Luu | Published: 2025-10-06 プロンプトインジェクションプロンプトの検証防御手法の統合 2025.10.06 文献データベース
NEXUS: Network Exploration for eXploiting Unsafe Sequences in Multi-Turn LLM Jailbreaks Authors: Javad Rafiei Asl, Sidhant Narula, Mohammad Ghasemigol, Eduardo Blanco, Daniel Takabi | Published: 2025-10-03 | Updated: 2025-10-21 プロンプトインジェクション大規模言語モデル脱獄手法 2025.10.03 文献データベース
FalseCrashReducer: Mitigating False Positive Crashes in OSS-Fuzz-Gen Using Agentic AI Authors: Paschal C. Amusuo, Dongge Liu, Ricardo Andres Calvo Mendez, Jonathan Metzman, Oliver Chang, James C. Davis | Published: 2025-10-02 プログラム解析プロンプトインジェクション誤検知管理 2025.10.02 文献データベース
Bypassing Prompt Guards in Production with Controlled-Release Prompting Authors: Jaiden Fairoze, Sanjam Garg, Keewoo Lee, Mingyuan Wang | Published: 2025-10-02 プロンプトインジェクション大規模言語モデル構造的攻撃 2025.10.02 文献データベース
Fingerprinting LLMs via Prompt Injection Authors: Yuepeng Hu, Zhengyuan Jiang, Mengyuan Li, Osama Ahmed, Zhicong Huang, Cheng Hong, Neil Gong | Published: 2025-09-29 | Updated: 2025-10-01 インダイレクトプロンプトインジェクショントークン識別手法プロンプトインジェクション 2025.09.29 文献データベース
MaskSQL: Safeguarding Privacy for LLM-Based Text-to-SQL via Abstraction Authors: Sepideh Abedini, Shubhankar Mohapatra, D. B. Emerson, Masoumeh Shafieinejad, Jesse C. Cresswell, Xi He | Published: 2025-09-27 | Updated: 2025-09-30 SQLクエリ生成プロンプトインジェクションプロンプトリーキング 2025.09.27 文献データベース
RLCracker: Exposing the Vulnerability of LLM Watermarks with Adaptive RL Attacks Authors: Hanbo Huang, Yiran Zhang, Hao Zheng, Xuan Gong, Yihan Li, Lin Liu, Shiyu Liang | Published: 2025-09-25 LLMの安全機構の解除プロンプトインジェクション透かし設計 2025.09.25 文献データベース