Proactive defense against LLM Jailbreak Authors: Weiliang Zhao, Jinjun Peng, Daniel Ben-Levi, Zhou Yu, Junfeng Yang | Published: 2025-10-06 LLMの安全機構の解除プロンプトインジェクション防御手法の統合 2025.10.06 文献データベース
P2P: A Poison-to-Poison Remedy for Reliable Backdoor Defense in LLMs Authors: Shuai Zhao, Xinyi Wu, Shiqian Zhao, Xiaobao Wu, Zhongliang Guo, Yanhao Jia, Anh Tuan Luu | Published: 2025-10-06 プロンプトインジェクションプロンプトの検証防御手法の統合 2025.10.06 文献データベース
NEXUS: Network Exploration for eXploiting Unsafe Sequences in Multi-Turn LLM Jailbreaks Authors: Javad Rafiei Asl, Sidhant Narula, Mohammad Ghasemigol, Eduardo Blanco, Daniel Takabi | Published: 2025-10-03 | Updated: 2025-10-21 プロンプトインジェクション大規模言語モデル脱獄手法 2025.10.03 文献データベース
Untargeted Jailbreak Attack Authors: Xinzhe Huang, Wenjing Hu, Tianhang Zheng, Kedong Xiu, Xiaojun Jia, Di Wang, Zhan Qin, Kui Ren | Published: 2025-10-03 | Updated: 2025-10-28 プロンプトインジェクションプロンプトリーキング防御手法の効果分析 2025.10.03 文献データベース
FalseCrashReducer: Mitigating False Positive Crashes in OSS-Fuzz-Gen Using Agentic AI Authors: Paschal C. Amusuo, Dongge Liu, Ricardo Andres Calvo Mendez, Jonathan Metzman, Oliver Chang, James C. Davis | Published: 2025-10-02 プログラム解析プロンプトインジェクション誤検知管理 2025.10.02 文献データベース
Bypassing Prompt Guards in Production with Controlled-Release Prompting Authors: Jaiden Fairoze, Sanjam Garg, Keewoo Lee, Mingyuan Wang | Published: 2025-10-02 プロンプトインジェクション大規模言語モデル構造的攻撃 2025.10.02 文献データベース
Fingerprinting LLMs via Prompt Injection Authors: Yuepeng Hu, Zhengyuan Jiang, Mengyuan Li, Osama Ahmed, Zhicong Huang, Cheng Hong, Neil Gong | Published: 2025-09-29 | Updated: 2025-10-01 インダイレクトプロンプトインジェクショントークン識別手法プロンプトインジェクション 2025.09.29 文献データベース
MaskSQL: Safeguarding Privacy for LLM-Based Text-to-SQL via Abstraction Authors: Sepideh Abedini, Shubhankar Mohapatra, D. B. Emerson, Masoumeh Shafieinejad, Jesse C. Cresswell, Xi He | Published: 2025-09-27 | Updated: 2025-09-30 SQLクエリ生成プロンプトインジェクションプロンプトリーキング 2025.09.27 文献データベース
RLCracker: Exposing the Vulnerability of LLM Watermarks with Adaptive RL Attacks Authors: Hanbo Huang, Yiran Zhang, Hao Zheng, Xuan Gong, Yihan Li, Lin Liu, Shiyu Liang | Published: 2025-09-25 LLMの安全機構の解除プロンプトインジェクション透かし設計 2025.09.25 文献データベース
Can Federated Learning Safeguard Private Data in LLM Training? Vulnerabilities, Attacks, and Defense Evaluation Authors: Wenkai Guo, Xuefeng Liu, Haolin Wang, Jianwei Niu, Shaojie Tang, Jing Yuan | Published: 2025-09-25 プライバシー保護手法プロンプトインジェクションポイズニング 2025.09.25 文献データベース