Attention is All You Need to Defend Against Indirect Prompt Injection Attacks in LLMs Authors: Yinan Zhong, Qianhao Miao, Yanjiao Chen, Jiangyi Deng, Yushi Cheng, Wenyuan Xu | Published: 2025-12-09 インダイレクトプロンプトインジェクションプロンプトの検証大規模言語モデル 2025.12.09 文献データベース
LLMs can hide text in other text of the same length Authors: Antonio Norelli, Michael Bronstein | Published: 2025-10-22 | Updated: 2025-10-27 プライバシー保護プロンプトの検証教育目的の情報提供 2025.10.22 文献データベース
PromptLocate: Localizing Prompt Injection Attacks Authors: Yuqi Jia, Yupei Liu, Zedian Shao, Jinyuan Jia, Neil Gong | Published: 2025-10-14 プロンプトの検証大規模言語モデル評価指標 2025.10.14 文献データベース
P2P: A Poison-to-Poison Remedy for Reliable Backdoor Defense in LLMs Authors: Shuai Zhao, Xinyi Wu, Shiqian Zhao, Xiaobao Wu, Zhongliang Guo, Yanhao Jia, Anh Tuan Luu | Published: 2025-10-06 プロンプトインジェクションプロンプトの検証防御手法の統合 2025.10.06 文献データベース
Detection of security smells in IaC scripts through semantics-aware code and language processing Authors: Aicha War, Adnan A. Rawass, Abdoul K. Kabore, Jordan Samhi, Jacques Klein, Tegawende F. Bissyande | Published: 2025-09-23 コード表現技術セキュリティ分析プロンプトの検証 2025.09.23 文献データベース
EPT Benchmark: Evaluation of Persian Trustworthiness in Large Language Models Authors: Mohammad Reza Mirbagheri, Mohammad Mahdi Mirkamali, Zahra Motoshaker Arani, Ali Javeri, Amir Mahdi Sadeghzadeh, Rasool Jalili | Published: 2025-09-08 フェアネス学習プロンプトの検証安全性 2025.09.08 文献データベース
PromptCOS: Towards System Prompt Copyright Auditing for LLMs via Content-level Output Similarity Authors: Yuchen Yang, Yiming Li, Hongwei Yao, Enhao Huang, Shuo Shao, Bingrun Yang, Zhibo Wang, Dacheng Tao, Zhan Qin | Published: 2025-09-03 プロンプトの検証プロンプトリーキングモデル抽出攻撃 2025.09.03 文献データベース
EverTracer: Hunting Stolen Large Language Models via Stealthy and Robust Probabilistic Fingerprint Authors: Zhenhua Xu, Meng Han, Wenpeng Xing | Published: 2025-09-03 LLMの安全機構の解除データ保護手法プロンプトの検証 2025.09.03 文献データベース
PromptSleuth: Detecting Prompt Injection via Semantic Intent Invariance Authors: Mengxiao Wang, Yuxuan Zhang, Guofei Gu | Published: 2025-08-28 インダイレクトプロンプトインジェクションプロンプトインジェクションプロンプトの検証 2025.08.28 文献データベース
Attacking interpretable NLP systems Authors: Eldor Abdukhamidov, Tamer Abuhmed, Joanna C. S. Santos, Mohammed Abuhamad | Published: 2025-07-22 プロンプトインジェクションプロンプトの検証敵対的攻撃手法 2025.07.22 文献データベース