Attack Evaluation

A Novel Evaluation Framework for Assessing Resilience Against Prompt Injection Attacks in Large Language Models

Authors: Daniel Wankit Yip, Aysan Esmradi, Chun Fai Chan | Published: 2024-01-02

LLM Security

Prompt Injection

Attack Evaluation

2024.01.02 2025.05.27

Literature Database

Label-Only Model Inversion Attacks via Knowledge Transfer

Authors: Ngoc-Bao Nguyen, Keshigeyan Chandrasegaran, Milad Abdollahzadeh, Ngai-Man Cheung | Published: 2023-10-30

Privacy Technique

Attack Evaluation

Deep Learning Method

2023.10.30 2025.05.28

Literature Database

SecurityNet: Assessing Machine Learning Vulnerabilities on Public Models

Authors: Boyang Zhang, Zheng Li, Ziqing Yang, Xinlei He, Michael Backes, Mario Fritz, Yang Zhang | Published: 2023-10-19

Membership Inference

Model Extraction Attack

Attack Evaluation

2023.10.19 2025.05.28

Literature Database

Attack Prompt Generation for Red Teaming and Defending Large Language Models

Authors: Boyi Deng, Wenjie Wang, Fuli Feng, Yang Deng, Qifan Wang, Xiangnan He | Published: 2023-10-19

Prompt Injection

Attack Evaluation

Adversarial Example

2023.10.19 2025.05.28

Literature Database

Last One Standing: A Comparative Analysis of Security and Privacy of Soft Prompt Tuning, LoRA, and In-Context Learning

Authors: Rui Wen, Tianhao Wang, Michael Backes, Yang Zhang, Ahmed Salem | Published: 2023-10-17

Privacy Technique

Model Extraction Attack

Attack Evaluation

2023.10.17 2025.05.28

Literature Database

BufferSearch: Generating Black-Box Adversarial Texts With Lower Queries

Authors: Wenjie Lv, Zhen Wang, Yitao Zheng, Zhehua Zhong, Qi Xuan, Tianyi Chen | Published: 2023-10-14

Attack Evaluation

Adversarial Example

Optimization Methods

2023.10.14 2025.05.28

Literature Database

On the Feasibility of Cross-Language Detection of Malicious Packages in npm and PyPI

Authors: Piergiorgio Ladisa, Serena Elisa Ponta, Nicola Ronzoni, Matias Martinez, Olivier Barais | Published: 2023-10-14

Malicious Package Detection

Attack Evaluation

Feature Selection Method

2023.10.14 2025.05.28

Literature Database

Catastrophic Jailbreak of Open-source LLMs via Exploiting Generation

Authors: Yangsibo Huang, Samyak Gupta, Mengzhou Xia, Kai Li, Danqi Chen | Published: 2023-10-10

Prompt Injection

Attack Evaluation

Adversarial attack

2023.10.10 2025.05.28

Literature Database

Test-Time Poisoning Attacks Against Test-Time Adaptation Models

Authors: Tianshuo Cong, Xinlei He, Yun Shen, Yang Zhang | Published: 2023-08-16

Poisoning

Model Performance Evaluation

Attack Evaluation

2023.08.16 2025.05.28

Literature Database

Diff-CAPTCHA: An Image-based CAPTCHA with Security Enhanced by Denoising Diffusion Model

Authors: Ran Jiang, Sanfeng Zhang, Linfeng Liu, Yanbing Peng | Published: 2023-08-16

Security Assurance

Attack Evaluation

Watermark Robustness

2023.08.16 2025.05.28

Literature Database