Backdoor Attack

Steering Dialogue Dynamics for Robustness against Multi-turn Jailbreaking Attacks

Authors: Hanjiang Hu, Alexander Robey, Changliu Liu | Published: 2025-02-28 | Updated: 2025-08-25

Backdoor Attack

Prompt Injection

Watermark

2025.02.28 2025.08.27

Literature Database

BackdoorDM: A Comprehensive Benchmark for Backdoor Learning on Diffusion Model

Authors: Weilin Lin, Nanjun Zhou, Yanyun Wang, Jianze Li, Hui Xiong, Li Liu | Published: 2025-02-17 | Updated: 2025-07-21

Trigger Detection

Backdoor Attack

Performance Evaluation

2025.02.17 2025.07.23

Literature Database

Provably effective detection of effective data poisoning attacks

Authors: Jonathan Gallagher, Yasaman Esfandiari, Callen MacPhee, Michael Warren | Published: 2025-01-21

Backdoor Attack

Poisoning

Experimental Validation

2025.01.21 2025.05.27

Literature Database

BADTV: Unveiling Backdoor Threats in Third-Party Task Vectors

Authors: Chia-Yi Hsu, Yu-Lin Tsai, Yu Zhe, Yan-Lun Chen, Chih-Hsun Lin, Chia-Mu Yu, Yang Zhang, Chun-Ying Huang, Jun Sakuma | Published: 2025-01-04

Backdoor Attack

Defense Method

2025.01.04 2025.05.27

Literature Database

Mingling with the Good to Backdoor Federated Learning

Authors: Nuno Neves | Published: 2025-01-03

Backdoor Attack

Poisoning

2025.01.03 2025.05.27

Literature Database

HoneypotNet: Backdoor Attacks Against Model Extraction

Authors: Yixu Wang, Tianle Gu, Yan Teng, Yingchun Wang, Xingjun Ma | Published: 2025-01-02

Backdoor Attack

Model Extraction Attack

2025.01.02 2025.05.27

Literature Database

CL-Attack: Textual Backdoor Attacks via Cross-Lingual Triggers

Authors: Jingyi Zheng, Tianyi Hu, Tianshuo Cong, Xinlei He | Published: 2024-12-26 | Updated: 2025-03-31

LLM Security

Backdoor Attack

Vulnerability of Adversarial Examples

2024.12.26 2025.05.27

Literature Database

A Backdoor Attack Scheme with Invisible Triggers Based on Model Architecture Modification

Authors: Yuan Ma, Xu Ma, Jiankang Wei, Jinmeng Tang, Xiaoyu Zhang, Yilun Lyu, Kehao Chen, Jingtong Huang | Published: 2024-12-22 | Updated: 2025-01-06

Backdoor Attack

Poisoning

2024.12.22 2025.05.27

Literature Database

PoisonBench: Assessing Large Language Model Vulnerability to Data Poisoning

Authors: Tingchen Fu, Mrinank Sharma, Philip Torr, Shay B. Cohen, David Krueger, Fazl Barez | Published: 2024-10-11

LLM Performance Evaluation

Backdoor Attack

Poisoning

2024.10.11 2025.05.27

Literature Database

CAT: Concept-level backdoor ATtacks for Concept Bottleneck Models

Authors: Songning Lai, Jiayu Yang, Yu Huang, Lijie Hu, Tianlang Xue, Zhangyi Hu, Jiaxu Li, Haicheng Liao, Yutao Yue | Published: 2024-10-07

Backdoor Attack

Poisoning

2024.10.07 2025.05.27

Literature Database