PromptSleuth: Detecting Prompt Injection via Semantic Intent Invariance Authors: Mengxiao Wang, Yuxuan Zhang, Guofei Gu | Published: 2025-08-28 インダイレクトプロンプトインジェクションプロンプトインジェクションプロンプトの検証 2025.08.28 文献データベース
Disabling Self-Correction in Retrieval-Augmented Generation via Stealthy Retriever Poisoning Authors: Yanbo Dai, Zhenlan Ji, Zongjie Li, Kuan Li, Shuai Wang | Published: 2025-08-27 RAGRAGへのポイズニング攻撃プロンプトインジェクション 2025.08.27 文献データベース
Safety Alignment Should Be Made More Than Just A Few Attention Heads Authors: Chao Huang, Zefeng Zhang, Juewei Yue, Quangang Li, Chuang Zhang, Tingwen Liu | Published: 2025-08-27 プロンプトインジェクション大規模言語モデル注意メカニズム 2025.08.27 文献データベース
MAJIC: Markovian Adaptive Jailbreaking via Iterative Composition of Diverse Innovative Strategies Authors: Weiwei Qi, Shuo Shao, Wei Gu, Tianhang Zheng, Puning Zhao, Zhan Qin, Kui Ren | Published: 2025-08-18 アルゴリズム設計プロンプトインジェクション攻撃タイプ 2025.08.18 文献データベース
Systematic Analysis of MCP Security Authors: Yongjian Guo, Puzhuo Liu, Wanlun Ma, Zehang Deng, Xiaogang Zhu, Peng Di, Xi Xiao, Sheng Wen | Published: 2025-08-18 プロンプトインジェクション攻撃チェーン分析脆弱性評価手法 2025.08.18 文献データベース
Jailbreaking Commercial Black-Box LLMs with Explicitly Harmful Prompts Authors: Chiyu Zhang, Lu Zhou, Xiaogang Xu, Jiafei Wu, Liming Fang, Zhe Liu | Published: 2025-08-14 ソーシャルエンジニアリング攻撃プロンプトインジェクション大規模言語モデル 2025.08.14 文献データベース
Demystifying the Role of Rule-based Detection in AI Systems for Windows Malware Detection Authors: Andrea Ponte, Luca Demetrio, Luca Oneto, Ivan Tesfai Ogbu, Battista Biggio, Fabio Roli | Published: 2025-08-13 プロンプトインジェクションマルウェア検出手法不均衡データセット 2025.08.13 文献データベース
Attacks and Defenses Against LLM Fingerprinting Authors: Kevin Kurian, Ethan Holland, Sean Oesch | Published: 2025-08-12 プロンプトインジェクション強化学習透かし設計 2025.08.12 文献データベース
Oblivionis: A Lightweight Learning and Unlearning Framework for Federated Large Language Models Authors: Fuyao Zhang, Xinyu Yan, Tiantong Wu, Wenjie Li, Tianxiang Chen, Yang Cao, Ran Yan, Longtao Huang, Wei Yang Bryan Lim, Qiang Yang | Published: 2025-08-12 データ管理システムフレームワークプロンプトインジェクション 2025.08.12 文献データベース
Robust Anomaly Detection in O-RAN: Leveraging LLMs against Data Manipulation Attacks Authors: Thusitha Dayaratne, Ngoc Duy Pham, Viet Vo, Shangqi Lai, Sharif Abuadbba, Hajime Suzuki, Xingliang Yuan, Carsten Rudolph | Published: 2025-08-11 フレームワークプロンプトインジェクション性能評価手法 2025.08.11 文献データベース