CrossGuard: Safeguarding MLLMs against Joint-Modal Implicit Malicious Attacks Authors: Xu Zhang, Hao Li, Zhichao Lu | Published: 2025-10-20 クエリ生成手法プロンプトインジェクション大規模言語モデル 2025.10.20 文献データベース
Multimodal Safety Is Asymmetric: Cross-Modal Exploits Unlock Black-Box MLLMs Jailbreaks Authors: Xinkai Wang, Beibei Li, Zerui Shao, Ao Liu, Shouling Ji | Published: 2025-10-20 LLMの安全機構の解除プロンプトインジェクション悪意のあるコンテンツ生成 2025.10.20 文献データベース
Are My Optimized Prompts Compromised? Exploring Vulnerabilities of LLM-based Optimizers Authors: Andrew Zhao, Reshmi Ghosh, Vitor Carvalho, Emily Lawton, Keegan Hines, Gao Huang, Jack W. Stokes | Published: 2025-10-16 プロンプトインジェクションプロンプトリーキング大規模言語モデル 2025.10.16 文献データベース
LLM-Assisted Web Measurements Authors: Simone Bozzolan, Stefano Calzavara, Lorenzo Cazzaro | Published: 2025-10-09 AIによる出力のバイアスの検出アプリ分類手法プロンプトインジェクション 2025.10.09 文献データベース
Fewer Weights, More Problems: A Practical Attack on LLM Pruning Authors: Kazuki Egashira, Robin Staab, Thibaud Gloaguen, Mark Vero, Martin Vechev | Published: 2025-10-09 セキュリティ分析手法プロンプトインジェクション防御効果分析 2025.10.09 文献データベース
MetaDefense: Defending Finetuning-based Jailbreak Attack Before and During Generation Authors: Weisen Jiang, Sinno Jialin Pan | Published: 2025-10-09 プロンプトインジェクションロバスト性防御メカニズム 2025.10.09 文献データベース
Proactive defense against LLM Jailbreak Authors: Weiliang Zhao, Jinjun Peng, Daniel Ben-Levi, Zhou Yu, Junfeng Yang | Published: 2025-10-06 LLMの安全機構の解除プロンプトインジェクション防御手法の統合 2025.10.06 文献データベース
P2P: A Poison-to-Poison Remedy for Reliable Backdoor Defense in LLMs Authors: Shuai Zhao, Xinyi Wu, Shiqian Zhao, Xiaobao Wu, Zhongliang Guo, Yanhao Jia, Anh Tuan Luu | Published: 2025-10-06 プロンプトインジェクションプロンプトの検証防御手法の統合 2025.10.06 文献データベース
FalseCrashReducer: Mitigating False Positive Crashes in OSS-Fuzz-Gen Using Agentic AI Authors: Paschal C. Amusuo, Dongge Liu, Ricardo Andres Calvo Mendez, Jonathan Metzman, Oliver Chang, James C. Davis | Published: 2025-10-02 プログラム解析プロンプトインジェクション誤検知管理 2025.10.02 文献データベース
Bypassing Prompt Guards in Production with Controlled-Release Prompting Authors: Jaiden Fairoze, Sanjam Garg, Keewoo Lee, Mingyuan Wang | Published: 2025-10-02 プロンプトインジェクション大規模言語モデル構造的攻撃 2025.10.02 文献データベース