Output Constraints as Attack Surface: Exploiting Structured Generation to Bypass LLM Safety Mechanisms Authors: Shuoming Zhang, Jiacheng Zhao, Ruiyuan Xu, Xiaobing Feng, Huimin Cui | Published: 2025-03-31 LLMセキュリティLLMの安全機構の解除プロンプトインジェクション 2025.03.31 2025.04.03 文献データベース
Get the Agents Drunk: Memory Perturbations in Autonomous Agent-based Recommender Systems Authors: Shiyi Yang, Zhibo Hu, Chen Wang, Tong Yu, Xiwei Xu, Liming Zhu, Lina Yao | Published: 2025-03-31 LLMセキュリティインダイレクトプロンプトインジェクションモデルDoS 2025.03.31 2025.04.03 文献データベース
Intelligent IoT Attack Detection Design via ODLLM with Feature Ranking-based Knowledge Base Authors: Satvik Verma, Qun Wang, E. Wes Bethel | Published: 2025-03-27 DDoS攻撃検出LLMセキュリティネットワークトラフィック分析 2025.03.27 2025.04.03 文献データベース
CL-Attack: Textual Backdoor Attacks via Cross-Lingual Triggers Authors: Jingyi Zheng, Tianyi Hu, Tianshuo Cong, Xinlei He | Published: 2024-12-26 | Updated: 2025-03-31 LLMセキュリティバックドア攻撃敵対的サンプルの脆弱性 2024.12.26 2025.04.03 文献データベース
SecAlign: Defending Against Prompt Injection with Preference Optimization Authors: Sizhe Chen, Arman Zharmagambetov, Saeed Mahloujifar, Kamalika Chaudhuri, David Wagner, Chuan Guo | Published: 2024-10-07 | Updated: 2025-01-13 LLMセキュリティプロンプトインジェクション防御手法 2024.10.07 2025.04.03 文献データベース
Taylor Unswift: Secured Weight Release for Large Language Models via Taylor Expansion Authors: Guanchu Wang, Yu-Neng Chuang, Ruixiang Tang, Shaochen Zhong, Jiayi Yuan, Hongye Jin, Zirui Liu, Vipin Chaudhary, Shuai Xu, James Caverlee, Xia Hu | Published: 2024-10-06 LLMセキュリティ暗号技術 2024.10.06 2025.04.03 文献データベース
Harnessing Task Overload for Scalable Jailbreak Attacks on Large Language Models Authors: Yiting Dong, Guobin Shen, Dongcheng Zhao, Xiang He, Yi Zeng | Published: 2024-10-05 LLMセキュリティプロンプトインジェクション攻撃手法 2024.10.05 2025.04.03 文献データベース
Towards Assuring EU AI Act Compliance and Adversarial Robustness of LLMs Authors: Tomas Bueno Momcilovic, Beat Buesser, Giulio Zizzo, Mark Purcell, Dian Balta | Published: 2024-10-04 AIコンプライアンスLLMセキュリティフレームワーク 2024.10.04 2025.04.03 文献データベース
Developing Assurance Cases for Adversarial Robustness and Regulatory Compliance in LLMs Authors: Tomas Bueno Momcilovic, Dian Balta, Beat Buesser, Giulio Zizzo, Mark Purcell | Published: 2024-10-04 LLMセキュリティプロンプトインジェクション動的脆弱性管理 2024.10.04 2025.04.03 文献データベース
Optimizing Adaptive Attacks against Content Watermarks for Language Models Authors: Abdulrahman Diaa, Toluwani Aremu, Nils Lukas | Published: 2024-10-03 LLMセキュリティウォーターマーキングプロンプトインジェクション 2024.10.03 2025.04.03 文献データベース