バックドアモデルの検知

Semantic Consensus Decoding: Backdoor Defense for Verilog Code Generation

Authors: Guang Yang, Xing Hu, Xiang Chen, Xin Xia | Published: 2026-02-04

コード生成のセキュリティ

バックドアモデルの検知

モデル抽出攻撃

2026.02.04

文献データベース

Malware Detection Through Memory Analysis

Authors: Sarah Nassar | Published: 2026-02-02

バックドアモデルの検知

特徴エンジニアリング

評価メトリクス

2026.02.02

文献データベース

On damage of interpolation to adversarial robustness in regression

Authors: Jingfu Peng, Yuhong Yang | Published: 2026-01-22

バックドアモデルの検知

ロバスト性評価

敵対的学習

2026.01.22

文献データベース

Causal-Guided Detoxify Backdoor Attack of Open-Weight LoRA Models

Authors: Linzhi Chen, Yang Sun, Hongru Wei, Yuqi Chen | Published: 2025-12-22

バックドアモデルの検知

モデル抽出攻撃の検知

敵対的攻撃評価

2025.12.22

文献データベース

PrivTune: Efficient and Privacy-Preserving Fine-Tuning of Large Language Models via Device-Cloud Collaboration

Authors: Yi Liu, Weixiang Han, Chengjun Cai, Xingliang Yuan, Cong Wang | Published: 2025-12-09

バックドアモデルの検知

プライバシー保証

プライバシー分析

2025.12.09

文献データベース

Subtract the Corruption: Training-Data-Free Corrective Machine Unlearning using Task Arithmetic

Authors: Mostafa Mozafari, Farooq Ahmad Wani, Maria Sofia Bucarelli, Fabrizio Silvestri | Published: 2025-11-24

トリガーの検知

バックドアモデルの検知

適応型再訓練メカニズム

2025.11.24

文献データベース

The ‘Sure’ Trap: Multi-Scale Poisoning Analysis of Stealthy Compliance-Only Backdoors in Fine-Tuned Large Language Models

Authors: Yuting Tan, Yi Huang, Zhuo Li | Published: 2025-11-16

トリガーの検知

バックドアモデルの検知

バックドア攻撃

2025.11.16

文献データベース

RHINO: Guided Reasoning for Mapping Network Logs to Adversarial Tactics and Techniques with Large Language Models

Authors: Fanchao Meng, Jiaping Gui, Yunbo Li, Yue Wu | Published: 2025-10-16

ネットワークトラフィック分析

バックドアモデルの検知

評価手法

2025.10.16

文献データベース

Who Speaks for the Trigger? Dynamic Expert Routing in Backdoored Mixture-of-Experts Transformers

Authors: Xin Zhao, Xiaojun Chen, Bingshan Liu, Haoyu Gao, Zhendong Zhao, Yilong Chen | Published: 2025-10-15

バックドアモデルの検知

プロンプトリーキング

大規模言語モデル

2025.10.15

文献データベース

DeepTrust: Multi-Step Classification through Dissimilar Adversarial Representations for Robust Android Malware Detection

Authors: Daniel Pulido-Cortázar, Daniel Gibert, Felip Manyà | Published: 2025-10-14

バックドアモデルの検知

モデルの頑健性保証

ロバスト性

2025.10.14

文献データベース