Your Agent Can Defend Itself against Backdoor Attacks Authors: Li Changjiang, Liang Jiacheng, Cao Bochuan, Chen Jinghui, Wang Ting | Published: 2025-06-10 | Updated: 2025-06-11 RAGへのポイズニング攻撃バックドア攻撃対策防御手法 2025.06.10 文献データベース
TracLLM: A Generic Framework for Attributing Long Context LLMs Authors: Yanting Wang, Wei Zou, Runpeng Geng, Jinyuan Jia | Published: 2025-06-04 LLMとの協力効果RAGへのポイズニング攻撃効率評価 2025.06.04 文献データベース
A Large Language Model-Supported Threat Modeling Framework for Transportation Cyber-Physical Systems Authors: M Sabbir Salek, Mashrur Chowdhury, Muhaimin Bin Munir, Yuchen Cai, Mohammad Imtiaz Hasan, Jean-Michel Tine, Latifur Khan, Mizanur Rahman | Published: 2025-06-01 | Updated: 2025-07-28 AIによる出力のバイアスの検出RAGへのポイズニング攻撃脆弱性評価手法 2025.06.01 文献データベース
MCP Safety Training: Learning to Refuse Falsely Benign MCP Exploits using Improved Preference Alignment Authors: John Halloran | Published: 2025-05-29 RAGへのポイズニング攻撃アライメント料理材料 2025.05.29 文献データベース
CPA-RAG:Covert Poisoning Attacks on Retrieval-Augmented Generation in Large Language Models Authors: Chunyang Li, Junwei Zhang, Anda Cheng, Zhuo Ma, Xinghua Li, Jianfeng Ma | Published: 2025-05-26 RAGへのポイズニング攻撃テキスト生成手法ポイズニング攻撃 2025.05.26 文献データベース
Silent Leaks: Implicit Knowledge Extraction Attack on RAG Systems through Benign Queries Authors: Yuhao Wang, Wenjie Qu, Yanze Jiang, Zichen Liu, Yue Liu, Shengfang Zhai, Yinpeng Dong, Jiaheng Zhang | Published: 2025-05-21 RAGRAGへのポイズニング攻撃プライバシー損失分析 2025.05.21 文献データベース
MARVEL: Multi-Agent RTL Vulnerability Extraction using Large Language Models Authors: Luca Collini, Baleegh Ahmad, Joey Ah-kiow, Ramesh Karri | Published: 2025-05-17 | Updated: 2025-06-09 RAGへのポイズニング攻撃サイバー脅威プロンプトインジェクション 2025.05.17 文献データベース
One Shot Dominance: Knowledge Poisoning Attack on Retrieval-Augmented Generation Systems Authors: Zhiyuan Chang, Mingyang Li, Xiaojun Jia, Junjie Wang, Yuekai Huang, Ziyou Jiang, Yang Liu, Qing Wang | Published: 2025-05-15 | Updated: 2025-05-20 RAGへのポイズニング攻撃ポイズニングポイズニング攻撃 2025.05.15 文献データベース
Securing RAG: A Risk Assessment and Mitigation Framework Authors: Lukas Ammann, Sara Ott, Christoph R. Landolt, Marco P. Lehmann | Published: 2025-05-13 LLMセキュリティRAGRAGへのポイズニング攻撃 2025.05.13 文献データベース
BadLingual: A Novel Lingual-Backdoor Attack against Large Language Models Authors: Zihan Wang, Hongwei Li, Rui Zhang, Wenbo Jiang, Kangjie Chen, Tianwei Zhang, Qingchuan Zhao, Guowen Xu | Published: 2025-05-06 RAGへのポイズニング攻撃バックドア攻撃対策敵対的学習 2025.05.06 文献データベース