AegisAgent: An Autonomous Defense Agent Against Prompt Injection Attacks in LLM-HARs Authors: Yihan Wang, Huanqi Yang, Shantanu Pal, Weitao Xu | Published: 2025-12-24 インダイレクトプロンプトインジェクションプロンプトインジェクション敵対的攻撃評価 2025.12.24 文献データベース
ChatGPT: Excellent Paper! Accept It. Editor: Imposter Found! Review Rejected Authors: Kanchon Gharami, Sanjiv Kumar Sarkar, Yongxin Liu, Shafika Showkat Moni | Published: 2025-12-23 プロンプトリーキングモデル抽出攻撃敵対的攻撃評価 2025.12.23 文献データベース
Causal-Guided Detoxify Backdoor Attack of Open-Weight LoRA Models Authors: Linzhi Chen, Yang Sun, Hongru Wei, Yuqi Chen | Published: 2025-12-22 バックドアモデルの検知モデル抽出攻撃の検知敵対的攻撃評価 2025.12.22 文献データベース
PR-Attack: Coordinated Prompt-RAG Attacks on Retrieval-Augmented Generation in Large Language Models via Bilevel Optimization Authors: Yang Jiao, Xiaodong Wang, Kai Yang | Published: 2025-04-10 LLM性能評価RAGへのポイズニング攻撃敵対的攻撃評価 2025.04.10 文献データベース
Guardians of the Agentic System: Preventing Many Shots Jailbreak with Agentic System Authors: Saikat Barua, Mostafizur Rahman, Md Jafor Sadek, Rafiul Islam, Shehenaz Khaled, Ahmedul Kabir | Published: 2025-02-23 | Updated: 2025-06-12 プロンプトインジェクション多エージェントシステムの評価敵対的攻撃評価 2025.02.23 文献データベース
Houdini: Fooling Deep Structured Prediction Models Authors: Moustapha Cisse, Yossi Adi, Natalia Neverova, Joseph Keshet | Published: 2017-07-17 モデルの頑健性保証敵対的攻撃評価音声認識技術 2017.07.17 2025.04.03 文献データベース