LLM Performance Evaluation

LLM4Fuzz: Guided Fuzzing of Smart Contracts with Large Language Models

Authors: Chaofan Shou, Jing Liu, Doudou Lu, Koushik Sen | Published: 2024-01-20

Smart Contract

Program Analysis

2024.01.20 2025.05.27

Literature Database

LLbezpeky: Leveraging Large Language Models for Vulnerability Detection

Authors: Noble Saji Mathews, Yelizaveta Brus, Yousra Aafer, Meiyappan Nagappan, Shane McIntosh | Published: 2024-01-02 | Updated: 2024-02-13

LLM Performance Evaluation

Prompt Injection

Vulnerability Management

2024.01.02 2025.05.27

Literature Database

Digger: Detecting Copyright Content Mis-usage in Large Language Model Training

Authors: Haodong Li, Gelei Deng, Yi Liu, Kailong Wang, Yuekang Li, Tianwei Zhang, Yang Liu, Guoai Xu, Guosheng Xu, Haoyu Wang | Published: 2024-01-01

LLM Performance Evaluation

Dataset Generation

Prompt Injection

2024.01.01 2025.05.27

Literature Database

SecQA: A Concise Question-Answering Dataset for Evaluating Large Language Models in Computer Security

Authors: Zefang Liu | Published: 2023-12-26

LLM Performance Evaluation

Cybersecurity

Prompt Injection

2023.12.26 2025.05.27

Literature Database

Binary Code Summarization: Benchmarking ChatGPT/GPT-4 and Other Large Language Models

Authors: Xin Jin, Jonathan Larson, Weiwei Yang, Zhiqiang Lin | Published: 2023-12-15

LLM Performance Evaluation

Program Analysis

Prompt Injection

2023.12.15 2025.05.27

Literature Database

LLMs Perform Poorly at Concept Extraction in Cyber-security Research Literature

Authors: Maxime Würsch, Andrei Kucharavy, Dimitri Percia David, Alain Mermoud | Published: 2023-12-12

LLM Performance Evaluation

Data Preprocessing

Knowledge Extraction Method

2023.12.12 2025.05.28

Literature Database

SmoothLLM: Defending Large Language Models Against Jailbreaking Attacks

Authors: Alexander Robey, Eric Wong, Hamed Hassani, George J. Pappas | Published: 2023-10-05 | Updated: 2024-06-11

LLM Performance Evaluation

Prompt Injection

Defense Method

2023.10.05 2025.05.28

Literature Database

Misusing Tools in Large Language Models With Visual Adversarial Examples

Authors: Xiaohan Fu, Zihan Wang, Shuheng Li, Rajesh K. Gupta, Niloofar Mireshghallah, Taylor Berg-Kirkpatrick, Earlence Fernandes | Published: 2023-10-04

LLM Performance Evaluation

Prompt Injection

Adversarial Example

2023.10.04 2025.05.28

Literature Database

Jailbreaker in Jail: Moving Target Defense for Large Language Models

Authors: Bocheng Chen, Advait Paliwal, Qiben Yan | Published: 2023-10-03

LLM Performance Evaluation

Prompt Injection

evaluation metrics

2023.10.03 2025.05.28

Literature Database

On the Safety of Open-Sourced Large Language Models: Does Alignment Really Prevent Them From Being Misused?

Authors: Hangfan Zhang, Zhimeng Guo, Huaisheng Zhu, Bochuan Cao, Lu Lin, Jinyuan Jia, Jinghui Chen, Dinghao Wu | Published: 2023-10-02

LLM Performance Evaluation

Prompt Injection

Classification of Malicious Actors

2023.10.02 2025.05.28

Literature Database