PRAG End-to-End Privacy-Preserving Retrieval-Augmented Generation Authors: Zhijun Li, Minghui Xu, Huayi Qi, Wenxuan Yu, Tingchuang Zhang, Qiao Zhang, GuangYong Shang, Zhen Ma, Xiuzhen Cheng | Published: 2026-04-29 RAGRAGへのポイズニング攻撃プライバシー保護手法 2026.04.29 文献データベース
SafeReview: Defending LLM-based Review Systems Against Adversarial Hidden Prompts Authors: Yuan Xin, Yixuan Weng, Minjun Zhu, Ying Ling, Chengwei Qin, Michael Hahn, Michael Backes, Yue Zhang, Linyi Yang | Published: 2026-04-29 LLM性能評価プロンプトインジェクションプロンプトの検証 2026.04.29 文献データベース
Quantamination: Dynamic Quantization Leaks Your Data Across the Batch Authors: Hanna Foerster, Ilia Shumailov, Cheng Zhang, Yiren Zhao, Jamie Hayes, Robert Mullins | Published: 2026-04-29 プライバシー損失分析プロンプトリーキングモデル抽出攻撃の検知 2026.04.29 文献データベース
Towards Agentic Investigation of Security Alerts Authors: Even Eilertsen, Vasileios Mavroeidis, Gudmund Grov | Published: 2026-04-28 LLM性能評価RAGへのポイズニング攻撃インダイレクトプロンプトインジェクション 2026.04.28 文献データベース
From CRUD to Autonomous Agents: Formal Validation and Zero-Trust Security for Semantic Gateways in AI-Native Enterprise Systems Authors: Ignacio Peyrano | Published: 2026-04-28 セキュアなロジスティック回帰動的アクセス制御脆弱性評価手法 2026.04.28 文献データベース
MARD: A Multi-Agent Framework for Robust Android Malware Detection Authors: Xueying Zeng, Youquan Xian, Sihao Liu, Xudong Mou, Yanze Li, Lei Cui, Bo Li | Published: 2026-04-28 LLM性能評価インダイレクトプロンプトインジェクション一般化性能 2026.04.28 文献データベース
R-CoT: A Reasoning-Layer Watermark via Redundant Chain-of-Thought in Large Language Models Authors: Ziming Zhang, Li Li, Guorui Feng, Hanzhou Wu, Xinpeng Zhang | Published: 2026-04-28 プロンプトインジェクション報酬関数設計検証可能な資格情報 2026.04.28 文献データベース
Making AI-Assisted Grant Evaluation Auditable without Exposing the Model Authors: Kemal Bicakci | Published: 2026-04-28 リスクシナリオ生成検証可能な資格情報評価手法 2026.04.28 文献データベース
AgentWard: A Lifecycle Security Architecture for Autonomous AI Agents Authors: Yixiang Zhang, Xinhao Deng, Jiaqing Wu, Yue Xiao, Ke Xu, Qi Li | Published: 2026-04-27 インダイレクトプロンプトインジェクションリスクシナリオ生成攻撃チェーン分析 2026.04.27 文献データベース
Layerwise Convergence Fingerprints for Runtime Misbehavior Detection in Large Language Models Authors: Nay Myat Min, Long H. Pham, Jun Sun | Published: 2026-04-27 インダイレクトプロンプトインジェクションプロンプトインジェクション一般化性能 2026.04.27 文献データベース