バックドア攻撃

On Protecting the Data Privacy of Large Language Models (LLMs): A Survey

Authors: Biwei Yan, Kun Li, Minghui Xu, Yueyan Dong, Yue Zhang, Zhaochun Ren, Xiuzhen Cheng | Published: 2024-03-08 | Updated: 2024-03-14

バックドア攻撃

プライバシー保護手法

プロンプトインジェクション

2024.03.08 2025.04.03

文献データベース

Mitigating Label Flipping Attacks in Malicious URL Detectors Using Ensemble Trees

Authors: Ehsan Nowroozi, Nada Jadalla, Samaneh Ghelichkhani, Alireza Jolfaei | Published: 2024-03-05

バックドア攻撃

ポイズニング

防御手法

2024.03.05 2025.04.03

文献データベース

Federated Learning Under Attack: Exposing Vulnerabilities through Data Poisoning Attacks in Computer Networks

Authors: Ehsan Nowroozi, Imran Haider, Rahim Taheri, Mauro Conti | Published: 2024-03-05

バックドア攻撃

ポイズニング

連合学習

2024.03.05 2025.04.03

文献データベース

Teach LLMs to Phish: Stealing Private Information from Language Models

Authors: Ashwinee Panda, Christopher A. Choquette-Choo, Zhengming Zhang, Yaoqing Yang, Prateek Mittal | Published: 2024-03-01

バックドア攻撃

フィッシング検出

プロンプトインジェクション

2024.03.01 2025.04.03

文献データベース

Learning to Poison Large Language Models for Downstream Manipulation

Authors: Xiangyu Zhou, Yao Qiang, Saleh Zare Zade, Mohammad Amin Roshani, Prashant Khanduri, Douglas Zytko, Dongxiao Zhu | Published: 2024-02-21 | Updated: 2025-05-29

LLMセキュリティ

バックドア攻撃

ポイズニング攻撃

2024.02.21

文献データベース

Indiscriminate Data Poisoning Attacks on Pre-trained Feature Extractors

Authors: Yiwei Lu, Matthew Y. R. Yang, Gautam Kamath, Yaoliang Yu | Published: 2024-02-20

バックドア攻撃

ポイズニング

転移学習

2024.02.20 2025.04.03

文献データベース

Test-Time Backdoor Attacks on Multimodal Large Language Models

Authors: Dong Lu, Tianyu Pang, Chao Du, Qian Liu, Xianjun Yang, Min Lin | Published: 2024-02-13

バックドア攻撃

モデル性能評価

攻撃手法

2024.02.13 2025.04.03

文献データベース

Game-Theoretic Unlearnable Example Generator

Authors: Shuang Liu, Yihan Wang, Xiao-Shan Gao | Published: 2024-01-31

ウォーターマーキング

バックドア攻撃

ポイズニング

2024.01.31 2025.04.03

文献データベース

Decentralized Federated Learning: A Survey on Security and Privacy

Authors: Ehsan Hallaji, Roozbeh Razavi-Far, Mehrdad Saif, Boyu Wang, Qiang Yang | Published: 2024-01-25

DFLに対する攻撃手法

バックドア攻撃

プライバシー保護手法

2024.01.25 2025.04.03

文献データベース

Unraveling Attacks in Machine Learning-based IoT Ecosystems: A Survey and the Open Libraries Behind Them

Authors: Chao Liu, Boxi Chen, Wei Shao, Chris Zhang, Kelvin Wong, Yi Zhang | Published: 2024-01-22 | Updated: 2024-01-27

バックドア攻撃

プライバシー保護手法

メンバーシップ推論

2024.01.22 2025.04.03

文献データベース