バックドア攻撃手法

Non-omniscient backdoor injection with a single poison sample: Proving the one-poison hypothesis for linear regression and linear classification

Authors: Thorsten Peinemann, Paula Arnold, Sebastian Berndt, Thomas Eisenbarth, Esfandiar Mohammadi | Published: 2025-08-07

バックドア攻撃

バックドア攻撃手法

ポイズニング

2025.08.07

文献データベース

ConfGuard: A Simple and Effective Backdoor Detection for Large Language Models

Authors: Zihan Wang, Rui Zhang, Hongwei Li, Wenshu Fan, Wenbo Jiang, Qingchuan Zhao, Guowen Xu | Published: 2025-08-02 | Updated: 2025-08-05

バックドアモデルの検知

バックドア攻撃手法

モデルDoS

2025.08.02

文献データベース

ICLShield: Exploring and Mitigating In-Context Learning Backdoor Attacks

Authors: Zhiyao Ren, Siyuan Liang, Aishan Liu, Dacheng Tao | Published: 2025-07-02

ICL防御メカニズム

トリガーの検知

バックドア攻撃手法

2025.07.02

文献データベース

SPA: Towards More Stealth and Persistent Backdoor Attacks in Federated Learning

Authors: Chengcheng Zhu, Ye Li, Bosen Rao, Jiale Zhang, Yunlong Mao, Sheng Zhong | Published: 2025-06-26

トリガーの検知

バックドア攻撃手法

連合学習

2025.06.26

文献データベース

BadMoE: Backdooring Mixture-of-Experts LLMs via Optimizing Routing Triggers and Infecting Dormant Experts

Authors: Qingyue Wang, Qi Pang, Xixun Lin, Shuai Wang, Daoyuan Wu | Published: 2025-04-24 | Updated: 2025-04-29

RAGへのポイズニング攻撃

バックドア攻撃手法

攻撃手法

2025.04.24

文献データベース

Enhancing Prompt Injection Attacks to LLMs via Poisoning Alignment

Authors: Zedian Shao, Hongbin Liu, Jaden Mu, Neil Zhenqiang Gong | Published: 2024-10-18 | Updated: 2025-09-15

インダイレクトプロンプトインジェクション

データ汚染検出

バックドア攻撃手法

2024.10.18

文献データベース

Unlearning Backdoor Attacks for LLMs with Weak-to-Strong Knowledge Distillation

Authors: Shuai Zhao, Xiaobao Wu, Cong-Duy Nguyen, Yanhao Jia, Meihuizi Jia, Yichao Feng, Luu Anh Tuan | Published: 2024-10-18 | Updated: 2025-05-20

バックドアモデルの検知

バックドア攻撃手法

知識蒸留

2024.10.18

文献データベース

Is poisoning a real threat to LLM alignment? Maybe more so than you think

Authors: Pankayaraj Pathmanathan, Souradip Chakraborty, Xiangyu Liu, Yongyuan Liang, Furong Huang | Published: 2024-06-17 | Updated: 2025-06-09

トレーニング手法

バックドア攻撃手法

毒データの検知

2024.06.17

文献データベース

SGBA: A Stealthy Scapegoat Backdoor Attack against Deep Neural Networks

Authors: Ying He, Zhili Shen, Chang Xia, Jingyu Hua, Wei Tong, Sheng Zhong | Published: 2021-04-02 | Updated: 2022-05-16

バックドア攻撃手法

ポイズニング攻撃

敵対的サンプル

2021.04.02 2025.04.03

文献データベース

Simeon — Secure Federated Machine Learning Through Iterative Filtering

Authors: Nicholas Malecki, Hye-young Paik, Aleksandar Ignjatovic, Alan Blair, Elisa Bertino | Published: 2021-03-13

バックドア攻撃手法

ビザンチン合意メカニズム

敵対的攻撃手法

2021.03.13 2025.04.03

文献データベース