HarmNet: A Framework for Adaptive Multi-Turn Jailbreak Attacks on Large Language Models Authors: Sidhant Narula, Javad Rafiei Asl, Mohammad Ghasemigol, Eduardo Blanco, Daniel Takabi | Published: 2025-10-21 クエリ生成手法大規模言語モデル脱獄手法 2025.10.21 文献データベース
VERA-V: Variational Inference Framework for Jailbreaking Vision-Language Models Authors: Qilin Liao, Anamika Lochab, Ruqi Zhang | Published: 2025-10-20 モデルDoS大規模言語モデル未ターゲット毒性攻撃 2025.10.20 文献データベース
CrossGuard: Safeguarding MLLMs against Joint-Modal Implicit Malicious Attacks Authors: Xu Zhang, Hao Li, Zhichao Lu | Published: 2025-10-20 クエリ生成手法プロンプトインジェクション大規模言語モデル 2025.10.20 文献データベース
SoK: Taxonomy and Evaluation of Prompt Security in Large Language Models Authors: Hanbin Hong, Shuya Feng, Nima Naderloui, Shenao Yan, Jingyu Zhang, Biying Liu, Ali Arastehfard, Heqing Huang, Yuan Hong | Published: 2025-10-17 | Updated: 2025-10-21 LLMセキュリティシナリオベースの悪用大規模言語モデル 2025.10.17 文献データベース
Are My Optimized Prompts Compromised? Exploring Vulnerabilities of LLM-based Optimizers Authors: Andrew Zhao, Reshmi Ghosh, Vitor Carvalho, Emily Lawton, Keegan Hines, Gao Huang, Jack W. Stokes | Published: 2025-10-16 プロンプトインジェクションプロンプトリーキング大規模言語モデル 2025.10.16 文献データベース
Terrarium: Revisiting the Blackboard for Multi-Agent Safety, Privacy, and Security Studies Authors: Mason Nakamura, Abhinav Kumar, Saaduddin Mahmud, Sahar Abdelnabi, Shlomo Zilberstein, Eugene Bagdasarian | Published: 2025-10-16 エージェント設計大規模言語モデル通信プロトコル 2025.10.16 文献データベース
In-Browser LLM-Guided Fuzzing for Real-Time Prompt Injection Testing in Agentic AI Browsers Authors: Avihay Cohen | Published: 2025-10-15 インダイレクトプロンプトインジェクション大規模言語モデル自動生成フレームワーク 2025.10.15 文献データベース
Who Speaks for the Trigger? Dynamic Expert Routing in Backdoored Mixture-of-Experts Transformers Authors: Xin Zhao, Xiaojun Chen, Bingshan Liu, Haoyu Gao, Zhendong Zhao, Yilong Chen | Published: 2025-10-15 バックドアモデルの検知プロンプトリーキング大規模言語モデル 2025.10.15 文献データベース
Evaluating and Mitigating LLM-as-a-judge Bias in Communication Systems Authors: Jiaxin Gao, Chen Chen, Yanwen Jia, Xueluan Gong, Kwok-Yan Lam, Qian Wang | Published: 2025-10-14 バイアスプロンプトリーキング大規模言語モデル 2025.10.14 文献データベース
Traveling Salesman-Based Token Ordering Improves Stability in Homomorphically Encrypted Language Models Authors: Donghwan Rho, Sieun Seo, Hyewon Sung, Chohong Min, Ernest K. Ryu | Published: 2025-10-14 トークン分布分析メンバーシップ推論大規模言語モデル 2025.10.14 文献データベース