ConfGuard: A Simple and Effective Backdoor Detection for Large Language Models Authors: Zihan Wang, Rui Zhang, Hongwei Li, Wenshu Fan, Wenbo Jiang, Qingchuan Zhao, Guowen Xu | Published: 2025-08-02 | Updated: 2025-08-05 バックドアモデルの検知バックドア攻撃手法モデルDoS 2025.08.02 文献データベース
Empirical Evaluation of Concept Drift in ML-Based Android Malware Detection Authors: Ahmed Sabbah, Radi Jarrar, Samer Zein, David Mohaisen | Published: 2025-07-30 ドリフト検出手法バックドアモデルの検知透かし技術の堅牢性 2025.07.30 文献データベース
The Dark Side of LLMs Agent-based Attacks for Complete Computer Takeover Authors: Matteo Lupinacci, Francesco Aurelio Pironti, Francesco Blefari, Francesco Romeo, Luigi Arena, Angelo Furfaro | Published: 2025-07-09 RAGへのポイズニング攻撃インダイレクトプロンプトインジェクションバックドアモデルの検知 2025.07.09 文献データベース
RawMal-TF: Raw Malware Dataset Labeled by Type and Family Authors: David Bálik, Martin Jureček, Mark Stamp | Published: 2025-06-30 バックドアモデルの検知プロンプトインジェクションマルウェア分類のためのデータセット 2025.06.30 文献データベース
PrivacyXray: Detecting Privacy Breaches in LLMs through Semantic Consistency and Probability Certainty Authors: Jinwen He, Yiyang Lu, Zijin Lin, Kai Chen, Yue Zhao | Published: 2025-06-24 バックドアモデルの検知プライバシー保護プライバシー保護フレームワーク 2025.06.24 文献データベース
Transformers for Secure Hardware Systems: Applications, Challenges, and Outlook Authors: Banafsheh Saber Latibari, Najmeh Nazari, Avesta Sasan, Houman Homayoun, Pratik Satam, Soheil Salehi, Hossein Sayadi | Published: 2025-05-28 セキュリティ分析ハードウェアトロイの検出バックドアモデルの検知 2025.05.28 文献データベース
ReCIT: Reconstructing Full Private Data from Gradient in Parameter-Efficient Fine-Tuning of Large Language Models Authors: Jin Xie, Ruishi He, Songze Li, Xiaojun Jia, Shouling Ji | Published: 2025-04-29 バックドアモデルの検知プライバシー侵害攻撃手法 2025.04.29 文献データベース
Secure Transfer Learning: Training Clean Models Against Backdoor in (Both) Pre-trained Encoders and Downstream Datasets Authors: Yechao Zhang, Yuxuan Zhou, Tianyu Li, Minghui Li, Shengshan Hu, Wei Luo, Leo Yu Zhang | Published: 2025-04-16 バックドアモデルの検知学習の改善防御手法の効果分析 2025.04.16 文献データベース
ToxicSQL: Migrating SQL Injection Threats into Text-to-SQL Models via Backdoor Attack Authors: Meiyu Lin, Haichuan Zhang, Jiale Lao, Renyuan Li, Yuanchun Zhou, Carl Yang, Yang Cao, Mingjie Tang | Published: 2025-03-07 | Updated: 2025-04-03 バックドアモデルの検知バックドア攻撃モデル性能評価 2025.03.07 文献データベース
ExpShield: Safeguarding Web Text from Unauthorized Crawling and Language Modeling Exploitation Authors: Ruixuan Liu, Toan Tran, Tianhao Wang, Hongsheng Hu, Shuo Wang, Li Xiong | Published: 2024-12-30 | Updated: 2025-05-07 テキストの摂動手法バックドアモデルの検知透かし技術 2024.12.30 文献データベース