A Cross-Language Investigation into Jailbreak Attacks in Large Language Models Authors: Jie Li, Yi Liu, Chongyang Liu, Ling Shi, Xiaoning Ren, Yaowen Zheng, Yang Liu, Yinxing Xue | Published: 2024-01-30 キャラクター役割演技プロンプトインジェクション多言語LLMジャイルブレイク 2024.01.30 2025.04.03 文献データベース
Detection and Defense Against Prominent Attacks on Preconditioned LLM-Integrated Virtual Assistants Authors: Chun Fai Chan, Daniel Wankit Yip, Aysan Esmradi | Published: 2024-01-02 LLMセキュリティキャラクター役割演技システムプロンプト生成 2024.01.02 2025.04.03 文献データベース
Dr. Jekyll and Mr. Hyde: Two Faces of LLMs Authors: Matteo Gioele Collu, Tom Janssen-Groesbeek, Stefanos Koffas, Mauro Conti, Stjepan Picek | Published: 2023-12-06 | Updated: 2024-10-07 キャラクター役割演技プロンプトインジェクションポイズニング 2023.12.06 2025.04.03 文献データベース
“Do Anything Now”: Characterizing and Evaluating In-The-Wild Jailbreak Prompts on Large Language Models Authors: Xinyue Shen, Zeyuan Chen, Michael Backes, Yun Shen, Yang Zhang | Published: 2023-08-07 | Updated: 2024-05-15 LLMセキュリティキャラクター役割演技プロンプトインジェクション 2023.08.07 2025.04.03 文献データベース