Enhancing Source Code Security with LLMs: Demystifying The Challenges and Generating Reliable Repairs Authors: Nafis Tanveer Islam, Joseph Khoury, Andrew Seong, Elias Bou-Harb, Peyman Najafirad | Published: 2024-09-01 LLMセキュリティ脆弱性管理自動脆弱性修復 2024.09.01 2025.04.03 文献データベース
LLM-PBE: Assessing Data Privacy in Large Language Models Authors: Qinbin Li, Junyuan Hong, Chulin Xie, Jeffrey Tan, Rachel Xin, Junyi Hou, Xavier Yin, Zhun Wang, Dan Hendrycks, Zhangyang Wang, Bo Li, Bingsheng He, Dawn Song | Published: 2024-08-23 | Updated: 2024-09-06 LLMセキュリティプライバシー保護手法プロンプトインジェクション 2024.08.23 2025.04.03 文献データベース
EEG-Defender: Defending against Jailbreak through Early Exit Generation of Large Language Models Authors: Chongwen Zhao, Zhihao Dou, Kaizhu Huang | Published: 2024-08-21 LLMセキュリティプロンプトインジェクション防御手法 2024.08.21 2025.04.03 文献データベース
Security Attacks on LLM-based Code Completion Tools Authors: Wen Cheng, Ke Sun, Xinyu Zhang, Wei Wang | Published: 2024-08-20 | Updated: 2025-01-02 LLMセキュリティプロンプトインジェクション攻撃手法 2024.08.20 2025.04.03 文献データベース
Transferring Backdoors between Large Language Models by Knowledge Distillation Authors: Pengzhou Cheng, Zongru Wu, Tianjie Ju, Wei Du, Zhuosheng Zhang Gongshen Liu | Published: 2024-08-19 LLMセキュリティバックドア攻撃ポイズニング 2024.08.19 2025.04.03 文献データベース
Antidote: Post-fine-tuning Safety Alignment for Large Language Models against Harmful Fine-tuning Authors: Tiansheng Huang, Gautam Bhattacharya, Pratik Joshi, Josh Kimball, Ling Liu | Published: 2024-08-18 | Updated: 2024-09-03 LLMセキュリティプロンプトインジェクション安全性アライメント 2024.08.18 2025.04.03 文献データベース
BaThe: Defense against the Jailbreak Attack in Multimodal Large Language Models by Treating Harmful Instruction as Backdoor Trigger Authors: Yulin Chen, Haoran Li, Yirui Zhang, Zihao Zheng, Yangqiu Song, Bryan Hooi | Published: 2024-08-17 | Updated: 2025-01-10 AIコンプライアンスLLMセキュリティコンテンツモデレーション 2024.08.17 2025.04.03 文献データベース
MIA-Tuner: Adapting Large Language Models as Pre-training Text Detector Authors: Wenjie Fu, Huandong Wang, Chen Gao, Guanghua Liu, Yong Li, Tao Jiang | Published: 2024-08-16 LLMセキュリティプロンプトインジェクションメンバーシップ推論 2024.08.16 2025.04.03 文献データベース
DePrompt: Desensitization and Evaluation of Personal Identifiable Information in Large Language Model Prompts Authors: Xiongtao Sun, Gan Liu, Zhipeng He, Hui Li, Xiaoguang Li | Published: 2024-08-16 LLMセキュリティプライバシー保護手法プロンプトインジェクション 2024.08.16 2025.04.03 文献データベース
Prefix Guidance: A Steering Wheel for Large Language Models to Defend Against Jailbreak Attacks Authors: Jiawei Zhao, Kejiang Chen, Xiaojian Yuan, Weiming Zhang | Published: 2024-08-15 | Updated: 2024-08-22 LLMセキュリティプロンプトインジェクション防御手法 2024.08.15 2025.04.03 文献データベース