Malicious Content Generation

Multimodal Safety Is Asymmetric: Cross-Modal Exploits Unlock Black-Box MLLMs Jailbreaks

Authors: Xinkai Wang, Beibei Li, Zerui Shao, Ao Liu, Shouling Ji | Published: 2025-10-20

Disabling Safety Mechanisms of LLM

Prompt Injection

Malicious Content Generation

2025.10.20 2025.10.22

Literature Database

Pandora: Jailbreak GPTs by Retrieval Augmented Generation Poisoning

Authors: Gelei Deng, Yi Liu, Kailong Wang, Yuekang Li, Tianwei Zhang, Yang Liu | Published: 2024-02-13

LLM Security

Prompt Injection

Malicious Content Generation

2024.02.13 2025.05.27

Literature Database

Jailbreaking Attack against Multimodal Large Language Model

Authors: Zhenxing Niu, Haodong Ren, Xinbo Gao, Gang Hua, Rong Jin | Published: 2024-02-04

Prompt Injection

Malicious Content Generation

Information Gathering Methods

2024.02.04 2025.05.27

Literature Database

Malla: Demystifying Real-world Large Language Model Integrated Malicious Services

Authors: Zilong Lin, Jian Cui, Xiaojing Liao, XiaoFeng Wang | Published: 2024-01-06 | Updated: 2024-08-19

Phishing Attack

Prompt Injection

Malicious Content Generation

2024.01.06 2025.05.27

Literature Database

REMARK-LLM: A Robust and Efficient Watermarking Framework for Generative Large Language Models

Authors: Ruisi Zhang, Shehzeen Samarah Hussain, Paarth Neekhara, Farinaz Koushanfar | Published: 2023-10-18 | Updated: 2024-04-08

Data Generation

Model Design

Malicious Content Generation

2023.10.18 2025.05.28

Literature Database

Digital Deception: Generative Artificial Intelligence in Social Engineering and Phishing

Authors: Marc Schmitt, Ivan Flechais | Published: 2023-10-15

Detection Rate of Phishing Attacks

Malicious Content Generation

Advanced Targeting

2023.10.15 2025.05.28

Literature Database

Shadow Alignment: The Ease of Subverting Safely-Aligned Language Models

Authors: Xianjun Yang, Xiao Wang, Qi Zhang, Linda Petzold, William Yang Wang, Xun Zhao, Dahua Lin | Published: 2023-10-04

Prompt Injection

Safety Alignment

Malicious Content Generation

2023.10.04 2025.05.28

Literature Database

Use of LLMs for Illicit Purposes: Threats, Prevention Measures, and Vulnerabilities

Authors: Maximilian Mozes, Xuanli He, Bennett Kleinberg, Lewis D. Griffin | Published: 2023-08-24

Prompt Injection

Malicious Content Generation

Adversarial Example

2023.08.24 2025.05.28

Literature Database

Universal Decision-Based Black-Box Perturbations: Breaking Security-Through-Obscurity Defenses

Authors: Thomas A. Hogan, Bhavya Kailkhura | Published: 2018-11-09 | Updated: 2018-11-13

Trigger Detection

Malicious Content Generation

Attack Evaluation

2018.11.09 2025.05.28

Literature Database

AdVersarial: Perceptual Ad Blocking meets Adversarial Machine Learning

Authors: Florian Tramèr, Pascal Dupré, Gili Rusak, Giancarlo Pellegrino, Dan Boneh | Published: 2018-11-08 | Updated: 2019-08-26

Poisoning

Malicious Content Generation

Adversarial Learning

2018.11.08 2025.05.28

Literature Database