Backdoor Attack Techniques

Non-omniscient backdoor injection with a single poison sample: Proving the one-poison hypothesis for linear regression and linear classification

Authors: Thorsten Peinemann, Paula Arnold, Sebastian Berndt, Thomas Eisenbarth, Esfandiar Mohammadi | Published: 2025-08-07

Backdoor Attack

Backdoor Attack Techniques

Poisoning

2025.08.07 2025.08.09

Literature Database

ConfGuard: A Simple and Effective Backdoor Detection for Large Language Models

Authors: Zihan Wang, Rui Zhang, Hongwei Li, Wenshu Fan, Wenbo Jiang, Qingchuan Zhao, Guowen Xu | Published: 2025-08-02 | Updated: 2025-08-05

Backdoor Detection

Backdoor Attack Techniques

Model DoS

2025.08.02 2025.08.07

Literature Database

ICLShield: Exploring and Mitigating In-Context Learning Backdoor Attacks

Authors: Zhiyao Ren, Siyuan Liang, Aishan Liu, Dacheng Tao | Published: 2025-07-02

ICL防御メカニズム

Trigger Detection

Backdoor Attack Techniques

2025.07.02 2025.07.04

Literature Database

BadMoE: Backdooring Mixture-of-Experts LLMs via Optimizing Routing Triggers and Infecting Dormant Experts

Authors: Qingyue Wang, Qi Pang, Xixun Lin, Shuai Wang, Daoyuan Wu | Published: 2025-04-24 | Updated: 2025-04-29

Poisoning attack on RAG

Backdoor Attack Techniques

Attack Method

2025.04.24 2025.05.27

Literature Database

Enhancing Prompt Injection Attacks to LLMs via Poisoning Alignment

Authors: Zedian Shao, Hongbin Liu, Jaden Mu, Neil Zhenqiang Gong | Published: 2024-10-18 | Updated: 2025-09-15

Indirect Prompt Injection

Data Contamination Detection

Backdoor Attack Techniques

2024.10.18 2025.09.17

Literature Database

Unlearning Backdoor Attacks for LLMs with Weak-to-Strong Knowledge Distillation

Authors: Shuai Zhao, Xiaobao Wu, Cong-Duy Nguyen, Yanhao Jia, Meihuizi Jia, Yichao Feng, Luu Anh Tuan | Published: 2024-10-18 | Updated: 2025-05-20

Backdoor Detection

Backdoor Attack Techniques

Knowledge Distillation

2024.10.18 2025.05.28

Literature Database

Is poisoning a real threat to LLM alignment? Maybe more so than you think

Authors: Pankayaraj Pathmanathan, Souradip Chakraborty, Xiangyu Liu, Yongyuan Liang, Furong Huang | Published: 2024-06-17 | Updated: 2025-06-09

Training Method

Backdoor Attack Techniques

Detection of Poisonous Data

2024.06.17 2025.06.11

Literature Database

SGBA: A Stealthy Scapegoat Backdoor Attack against Deep Neural Networks

Authors: Ying He, Zhili Shen, Chang Xia, Jingyu Hua, Wei Tong, Sheng Zhong | Published: 2021-04-02 | Updated: 2022-05-16

Backdoor Attack Techniques

Poisoning Attack

Adversarial Example

2021.04.02 2025.05.28

Literature Database

Simeon — Secure Federated Machine Learning Through Iterative Filtering

Authors: Nicholas Malecki, Hye-young Paik, Aleksandar Ignjatovic, Alan Blair, Elisa Bertino | Published: 2021-03-13

Backdoor Attack Techniques

Byzantine Consensus Mechanism

Adversarial Attack Methods

2021.03.13 2025.05.28

Literature Database

FLAME: Taming Backdoors in Federated Learning (Extended Version 1)

Authors: Thien Duc Nguyen, Phillip Rieger, Huili Chen, Hossein Yalame, Helen Möllering, Hossein Fereidooni, Samuel Marchal, Markus Miettinen, Azalia Mirhoseini, Shaza Zeitouni, Farinaz Koushanfar, Ahmad-Reza Sadeghi, Thomas Schneider | Published: 2021-01-06 | Updated: 2023-08-05

Backdoor Attack Techniques

Poisoning

Defense Effectiveness Analysis

2021.01.06 2025.05.28

Literature Database