Prompt Injection

A Novel Evaluation Framework for Assessing Resilience Against Prompt Injection Attacks in Large Language Models

Authors: Daniel Wankit Yip, Aysan Esmradi, Chun Fai Chan | Published: 2024-01-02

LLM Security

Prompt Injection

Attack Evaluation

2024.01.02 2025.05.27

Literature Database

Digger: Detecting Copyright Content Mis-usage in Large Language Model Training

Authors: Haodong Li, Gelei Deng, Yi Liu, Kailong Wang, Yuekang Li, Tianwei Zhang, Yang Liu, Guoai Xu, Guosheng Xu, Haoyu Wang | Published: 2024-01-01

LLM Performance Evaluation

Dataset Generation

Prompt Injection

2024.01.01 2025.05.27

Literature Database

Opening A Pandora’s Box: Things You Should Know in the Era of Custom GPTs

Authors: Guanhong Tao, Siyuan Cheng, Zhuo Zhang, Junmin Zhu, Guangyu Shen, Xiangyu Zhang | Published: 2023-12-31

Cybersecurity

Phishing Attack

Prompt Injection

2023.12.31 2025.05.27

Literature Database

Jatmo: Prompt Injection Defense by Task-Specific Finetuning

Authors: Julien Piet, Maha Alrashed, Chawin Sitawarin, Sizhe Chen, Zeming Wei, Elizabeth Sun, Basel Alomair, David Wagner | Published: 2023-12-29 | Updated: 2024-01-08

LLM Security

Cyber Attack

Prompt Injection

2023.12.29 2025.05.27

Literature Database

SecQA: A Concise Question-Answering Dataset for Evaluating Large Language Models in Computer Security

Authors: Zefang Liu | Published: 2023-12-26

LLM Performance Evaluation

Cybersecurity

Prompt Injection

2023.12.26 2025.05.27

Literature Database

ChatGPT, Llama, can you write my report? An experiment on assisted digital forensics reports written using (Local) Large Language Models

Authors: Gaëtan Michelet, Frank Breitinger | Published: 2023-12-22

Forensic Report

Prompt Injection

2023.12.22 2025.05.27

Literature Database

MetaAID 2.5: A Secure Framework for Developing Metaverse Applications via Large Language Models

Authors: Hongyin Zhu | Published: 2023-12-22

LLM Security

Data Generation

Prompt Injection

2023.12.22 2025.05.27

Literature Database

HW-V2W-Map: Hardware Vulnerability to Weakness Mapping Framework for Root Cause Analysis with GPT-assisted Mitigation Suggestion

Authors: Yu-Zheng Lin, Muntasir Mamun, Muhtasim Alam Chowdhury, Shuyu Cai, Mingyu Zhu, Banafsheh Saber Latibari, Kevin Immanuel Gubbi, Najmeh Nazari Bavarsad, Arjun Caputo, Avesta Sasan, Houman Homayoun, Setareh Rafatirad, Pratik Satam, Soheil Salehi | Published: 2023-12-21

CVE Information Extraction

Prompt Injection

Vulnerability Management

2023.12.21 2025.05.27

Literature Database

A Comprehensive Survey of Attack Techniques, Implementation, and Mitigation Strategies in Large Language Models

Authors: Aysan Esmradi, Daniel Wankit Yip, Chun Fai Chan | Published: 2023-12-18

Cyber Attack

Prompt Injection

Attack Method

2023.12.18 2025.05.27

Literature Database

JailGuard: A Universal Detection Framework for LLM Prompt-based Attacks

Authors: Xiaoyu Zhang, Cen Zhang, Tianlin Li, Yihao Huang, Xiaojun Jia, Ming Hu, Jie Zhang, Yang Liu, Shiqing Ma, Chao Shen | Published: 2023-12-17 | Updated: 2025-03-15

Text Perturbation Method

Prompt Injection

Attack Method

2023.12.17 2025.05.27

Literature Database