LLbezpeky: Leveraging Large Language Models for Vulnerability Detection Authors: Noble Saji Mathews, Yelizaveta Brus, Yousra Aafer, Meiyappan Nagappan, Shane McIntosh | Published: 2024-01-02 | Updated: 2024-02-13 LLM性能評価プロンプトインジェクション脆弱性管理 2024.01.02 2025.04.03 文献データベース
Digger: Detecting Copyright Content Mis-usage in Large Language Model Training Authors: Haodong Li, Gelei Deng, Yi Liu, Kailong Wang, Yuekang Li, Tianwei Zhang, Yang Liu, Guoai Xu, Guosheng Xu, Haoyu Wang | Published: 2024-01-01 LLM性能評価データセット生成プロンプトインジェクション 2024.01.01 2025.04.03 文献データベース
SecQA: A Concise Question-Answering Dataset for Evaluating Large Language Models in Computer Security Authors: Zefang Liu | Published: 2023-12-26 LLM性能評価サイバーセキュリティプロンプトインジェクション 2023.12.26 2025.04.03 文献データベース
Binary Code Summarization: Benchmarking ChatGPT/GPT-4 and Other Large Language Models Authors: Xin Jin, Jonathan Larson, Weiwei Yang, Zhiqiang Lin | Published: 2023-12-15 LLM性能評価プログラム解析プロンプトインジェクション 2023.12.15 2025.04.03 文献データベース
LLMs Perform Poorly at Concept Extraction in Cyber-security Research Literature Authors: Maxime Würsch, Andrei Kucharavy, Dimitri Percia David, Alain Mermoud | Published: 2023-12-12 LLM性能評価データ前処理知識抽出手法 2023.12.12 2025.04.03 文献データベース
SmoothLLM: Defending Large Language Models Against Jailbreaking Attacks Authors: Alexander Robey, Eric Wong, Hamed Hassani, George J. Pappas | Published: 2023-10-05 | Updated: 2024-06-11 LLM性能評価プロンプトインジェクション防御手法 2023.10.05 2025.04.03 文献データベース
Misusing Tools in Large Language Models With Visual Adversarial Examples Authors: Xiaohan Fu, Zihan Wang, Shuheng Li, Rajesh K. Gupta, Niloofar Mireshghallah, Taylor Berg-Kirkpatrick, Earlence Fernandes | Published: 2023-10-04 LLM性能評価プロンプトインジェクション敵対的サンプル 2023.10.04 2025.04.03 文献データベース
Jailbreaker in Jail: Moving Target Defense for Large Language Models Authors: Bocheng Chen, Advait Paliwal, Qiben Yan | Published: 2023-10-03 LLM性能評価プロンプトインジェクション評価指標 2023.10.03 2025.04.03 文献データベース
On the Safety of Open-Sourced Large Language Models: Does Alignment Really Prevent Them From Being Misused? Authors: Hangfan Zhang, Zhimeng Guo, Huaisheng Zhu, Bochuan Cao, Lu Lin, Jinyuan Jia, Jinghui Chen, Dinghao Wu | Published: 2023-10-02 LLM性能評価プロンプトインジェクション悪意のある行為者の分類 2023.10.02 2025.04.03 文献データベース
Watch Your Language: Investigating Content Moderation with Large Language Models Authors: Deepak Kumar, Yousef AbuHashem, Zakir Durumeric | Published: 2023-09-25 | Updated: 2024-01-17 LLM性能評価プロンプトインジェクション不適切コンテンツ生成 2023.09.25 2025.04.03 文献データベース