Benchmarking Practices in LLM-driven Offensive Security: Testbeds, Metrics, and Experiment Design Authors: Andreas Happe, Jürgen Cito | Published: 2025-04-14 テストベッドプロンプトの検証進捗追跡 2025.04.14 文献データベース
Can Indirect Prompt Injection Attacks Be Detected and Removed? Authors: Yulin Chen, Haoran Li, Yuan Sui, Yufei He, Yue Liu, Yangqiu Song, Bryan Hooi | Published: 2025-02-23 プロンプトの検証悪意のあるプロンプト攻撃手法 2025.02.23 2025.04.03 文献データベース
Feint and Attack: Attention-Based Strategies for Jailbreaking and Protecting LLMs Authors: Rui Pu, Chaozhuo Li, Rui Ha, Zejian Chen, Litian Zhang, Zheng Liu, Lirong Qiu, Zaisheng Ye | Published: 2024-10-18 | Updated: 2025-07-08 LLMの安全機構の解除プロンプトインジェクションプロンプトの検証 2024.10.18 文献データベース
Operationalizing a Threat Model for Red-Teaming Large Language Models (LLMs) Authors: Apurv Verma, Satyapriya Krishna, Sebastian Gehrmann, Madhavan Seshadri, Anu Pradhan, Tom Ault, Leslie Barrett, David Rabinowitz, John Doucette, NhatHai Phan | Published: 2024-07-20 | Updated: 2025-07-10 プロンプトインジェクションプロンプトの検証敵対的攻撃 2024.07.20 文献データベース
Toxicity Detection for Free Authors: Zhanhao Hu, Julien Piet, Geng Zhao, Jiantao Jiao, David Wagner | Published: 2024-05-29 | Updated: 2024-11-08 インダイレクトプロンプトインジェクションプロンプトの検証悪意のあるプロンプト 2024.05.29 2025.04.03 文献データベース
Large Language Model Sentinel: LLM Agent for Adversarial Purification Authors: Guang Lin, Toshihisa Tanaka, Qibin Zhao | Published: 2024-05-24 | Updated: 2025-04-23 プロンプトの検証敵対的テキスト浄化防御メカニズム 2024.05.24 文献データベース
Token-Level Adversarial Prompt Detection Based on Perplexity Measures and Contextual Information Authors: Zhengmian Hu, Gang Wu, Saayan Mitra, Ruiyi Zhang, Tong Sun, Heng Huang, Viswanathan Swaminathan | Published: 2023-11-20 | Updated: 2024-02-18 プロンプトインジェクションプロンプトの検証ロバスト性に関する評価 2023.11.20 2025.04.03 文献データベース
Fact-Checking Complex Claims with Program-Guided Reasoning Authors: Liangming Pan, Xiaobao Wu, Xinyuan Lu, Anh Tuan Luu, William Yang Wang, Min-Yen Kan, Preslav Nakov | Published: 2023-05-22 プロンプトの検証偽情報の検出実世界の事実確認 2023.05.22 2025.04.03 文献データベース
Towards Few-Shot Fact-Checking via Perplexity Authors: Nayeon Lee, Yejin Bang, Andrea Madotto, Madian Khabsa, Pascale Fung | Published: 2021-03-17 Few-Shot Learningプロンプトの検証偽情報の検出 2021.03.17 2025.04.03 文献データベース