Attacks on Third-Party APIs of Large Language Models Authors: Wanru Zhao, Vidit Khazanchi, Haodi Xing, Xuanli He, Qiongkai Xu, Nicholas Donald Lane | Published: 2024-04-24 LLMセキュリティプロンプトインジェクション攻撃手法 2024.04.24 2025.04.03 文献データベース
Act as a Honeytoken Generator! An Investigation into Honeytoken Generation with Large Language Models Authors: Daniel Reti, Norman Becker, Tillmann Angeli, Anasuya Chattopadhyay, Daniel Schneider, Sebastian Vollmer, Hans D. Schotten | Published: 2024-04-24 LLM性能評価ハニーポット技術プロンプトインジェクション 2024.04.24 2025.04.03 文献データベース
zkLLM: Zero Knowledge Proofs for Large Language Models Authors: Haochen Sun, Jason Li, Hongyang Zhang | Published: 2024-04-24 プロンプトインジェクション計算効率透かしの耐久性 2024.04.24 2025.04.03 文献データベース
Protecting Your LLMs with Information Bottleneck Authors: Zichuan Liu, Zefan Wang, Linjie Xu, Jinyu Wang, Lei Song, Tianchun Wang, Chunlin Chen, Wei Cheng, Jiang Bian | Published: 2024-04-22 | Updated: 2024-10-10 LLMセキュリティプロンプトインジェクション倫理的ガイドライン遵守 2024.04.22 2025.04.03 文献データベース
Competition Report: Finding Universal Jailbreak Backdoors in Aligned LLMs Authors: Javier Rando, Francesco Croce, Kryštof Mitka, Stepan Shabalin, Maksym Andriushchenko, Nicolas Flammarion, Florian Tramèr | Published: 2024-04-22 | Updated: 2024-06-06 LLMセキュリティバックドア攻撃プロンプトインジェクション 2024.04.22 2025.04.03 文献データベース
AdvPrompter: Fast Adaptive Adversarial Prompting for LLMs Authors: Anselm Paulus, Arman Zharmagambetov, Chuan Guo, Brandon Amos, Yuandong Tian | Published: 2024-04-21 LLMセキュリティプロンプトインジェクションプロンプトエンジニアリング 2024.04.21 2025.04.03 文献データベース
CyberSecEval 2: A Wide-Ranging Cybersecurity Evaluation Suite for Large Language Models Authors: Manish Bhatt, Sahana Chennabasappa, Yue Li, Cyrus Nikolaidis, Daniel Song, Shengye Wan, Faizan Ahmad, Cornelius Aschermann, Yaohui Chen, Dhaval Kapil, David Molnar, Spencer Whitman, Joshua Saxe | Published: 2024-04-19 LLMセキュリティサイバーセキュリティプロンプトインジェクション 2024.04.19 2025.04.03 文献データベース
JailbreakLens: Visual Analysis of Jailbreak Attacks Against Large Language Models Authors: Yingchaojie Feng, Zhizhang Chen, Zhining Kang, Sijia Wang, Minfeng Zhu, Wei Zhang, Wei Chen | Published: 2024-04-12 LLM性能評価プロンプトインジェクション評価手法 2024.04.12 2025.04.03 文献データベース
Online Safety Analysis for LLMs: a Benchmark, an Assessment, and a Path Forward Authors: Xuan Xie, Jiayang Song, Zhehua Zhou, Yuheng Huang, Da Song, Lei Ma | Published: 2024-04-12 LLMセキュリティLLM性能評価プロンプトインジェクション 2024.04.12 2025.04.03 文献データベース
Subtoxic Questions: Dive Into Attitude Change of LLM’s Response in Jailbreak Attempts Authors: Tianyu Zhang, Zixuan Zhao, Jiaqi Huang, Jingyu Hua, Sheng Zhong | Published: 2024-04-12 LLMセキュリティプロンプトインジェクションプロンプトエンジニアリング 2024.04.12 2025.04.03 文献データベース