Adversarially Robust and Interpretable Magecart Malware Detection Authors: Pedro Pereira, José Gouveia, João Vitorino, Eva Maia, Isabel Praça | Published: 2025-11-06 動的分析敵対的学習解釈可能性 2025.11.06 文献データベース
SPATA: Systematic Pattern Analysis for Detailed and Transparent Data Cards Authors: João Vitorino, Eva Maia, Isabel Praça, Carlos Soares | Published: 2025-09-30 プライバシー保護機械学習敵対的学習解釈可能性 2025.09.30 文献データベース
Backdoor Attribution: Elucidating and Controlling Backdoor in Language Models Authors: Miao Yu, Zhenhong Zhou, Moayad Aloqaily, Kun Wang, Biwei Huang, Stephen Wang, Yueming Jin, Qingsong Wen | Published: 2025-09-26 | Updated: 2025-09-30 LLMの安全機構の解除自己注意メカニズム解釈可能性 2025.09.26 文献データベース
CyberRAG: An agentic RAG cyber attack classification and reporting tool Authors: Francesco Blefari, Cristian Cosentino, Francesco Aurelio Pironti, Angelo Furfaro, Fabrizio Marozzo | Published: 2025-07-03 RAGへのポイズニング攻撃脆弱性分析解釈可能性 2025.07.03 文献データベース
ExpProof : Operationalizing Explanations for Confidential Models with ZKPs Authors: Chhavi Yadav, Evan Monroe Laufer, Dan Boneh, Kamalika Chaudhuri | Published: 2025-02-06 | Updated: 2025-05-27 XAI(説明可能なAI)モデル評価手法解釈可能性 2025.02.06 文献データベース
The Price of Interpretability Authors: Dimitris Bertsimas, Arthur Delarue, Patrick Jaillet, Sebastien Martin | Published: 2019-07-08 モデル選択最適化戦略解釈可能性 2019.07.08 2025.04.03 文献データベース
Bridging Adversarial Robustness and Gradient Interpretability Authors: Beomsu Kim, Junghoon Seo, Taegyun Jeon | Published: 2019-03-27 | Updated: 2019-04-19 モデルの頑健性保証敵対的学習解釈可能性 2019.03.27 2025.04.03 文献データベース