Auto-RT: Automatic Jailbreak Strategy Exploration for Red-Teaming Large Language Models Authors: Yanjiang Liu, Shuhen Zhou, Yaojie Lu, Huijia Zhu, Weiqiang Wang, Hongyu Lin, Ben He, Xianpei Han, Le Sun | Published: 2025-01-03 フレームワークプロンプトインジェクション攻撃手法 2025.01.03 2025.04.03 文献データベース
CySecBench: Generative AI-based CyberSecurity-focused Prompt Dataset for Benchmarking Large Language Models Authors: Johan Wahréus, Ahmed Mohamed Hussain, Panos Papadimitratos | Published: 2025-01-02 LLM性能評価サイバーセキュリティプロンプトインジェクション 2025.01.02 2025.04.03 文献データベース
Safeguarding Large Language Models in Real-time with Tunable Safety-Performance Trade-offs Authors: Joao Fonseca, Andrew Bell, Julia Stoyanovich | Published: 2025-01-02 フレームワークプロンプトインジェクション安全性アライメント 2025.01.02 2025.04.03 文献データベース
SPADE: Enhancing Adaptive Cyber Deception Strategies with Generative AI and Structured Prompt Engineering Authors: Shihab Ahmed, A B M Mohaimenur Rahman, Md Morshed Alam, Md Sajidul Islam Sajid | Published: 2025-01-01 サイバーセキュリティプロンプトインジェクションプロンプトエンジニアリング 2025.01.01 2025.04.03 文献データベース
SecBench: A Comprehensive Multi-Dimensional Benchmarking Dataset for LLMs in Cybersecurity Authors: Pengfei Jing, Mengyun Tang, Xiaorong Shi, Xing Zheng, Sen Nie, Shi Wu, Yong Yang, Xiapu Luo | Published: 2024-12-30 | Updated: 2025-01-06 LLM性能評価サイバーセキュリティプロンプトインジェクション 2024.12.30 2025.04.03 文献データベース
From Vulnerabilities to Remediation: A Systematic Literature Review of LLMs in Code Security Authors: Enna Basic, Alberto Giaretta | Published: 2024-12-19 | Updated: 2025-04-14 プロンプトインジェクションプロンプトリーキング脆弱性検出 2024.12.19 文献データベース
SATA: A Paradigm for LLM Jailbreak via Simple Assistive Task Linkage Authors: Xiaoning Dong, Wenbo Hu, Wei Xu, Tianxing He | Published: 2024-12-19 | Updated: 2025-03-21 プロンプトインジェクション大規模言語モデル敵対的学習 2024.12.19 2025.04.03 文献データベース
Safeguarding System Prompts for LLMs Authors: Zhifeng Jiang, Zhihua Jin, Guoliang He | Published: 2024-12-18 | Updated: 2025-01-09 LLM性能評価プロンプトインジェクション防御手法 2024.12.18 2025.04.03 文献データベース
Can LLM Prompting Serve as a Proxy for Static Analysis in Vulnerability Detection Authors: Ira Ceka, Feitong Qiao, Anik Dey, Aastha Valecha, Gail Kaiser, Baishakhi Ray | Published: 2024-12-16 | Updated: 2025-01-18 LLM性能評価プロンプティング戦略プロンプトインジェクション 2024.12.16 2025.04.03 文献データベース
Heuristic-Induced Multimodal Risk Distribution Jailbreak Attack for Multimodal Large Language Models Authors: Ma Teng, Jia Xiaojun, Duan Ranjie, Li Xinfeng, Huang Yihao, Chu Zhixuan, Liu Yang, Ren Wenqi | Published: 2024-12-08 | Updated: 2025-01-03 コンテンツモデレーションプロンプトインジェクション攻撃手法 2024.12.08 2025.04.03 文献データベース