“Yes, My LoRD.” Guiding Language Model Extraction with Locality Reinforced Distillation Authors: Zi Liang, Qingqing Ye, Yanyun Wang, Sen Zhang, Yaxin Xiao, Ronghua Li, Jianliang Xu, Haibo Hu | Published: 2024-09-04 | Updated: 2025-05-19 LLMセキュリティモデル抽出攻撃透かし技術 2024.09.04 文献データベース
Model Reconstruction Using Counterfactual Explanations: A Perspective From Polytope Theory Authors: Pasan Dissanayake, Sanghamitra Dutta | Published: 2024-05-08 | Updated: 2024-11-05 モデル性能評価モデル抽出攻撃透かし評価 2024.05.08 2025.04.03 文献データベース
QuantumLeak: Stealing Quantum Neural Networks from Cloud-based NISQ Machines Authors: Zhenxiao Fu, Min Yang, Cheng Chu, Yilun Xu, Gang Huang, Fan Chen | Published: 2024-03-16 ウォーターマーキングモデル抽出攻撃量子フレームワーク 2024.03.16 2025.04.03 文献データベース
Stealing Part of a Production Language Model Authors: Nicholas Carlini, Daniel Paleka, Krishnamurthy Dj Dvijotham, Thomas Steinke, Jonathan Hayase, A. Feder Cooper, Katherine Lee, Matthew Jagielski, Milad Nasr, Arthur Conmy, Itay Yona, Eric Wallace, David Rolnick, Florian Tramèr | Published: 2024-03-11 | Updated: 2024-07-09 プロンプトリーキングモデルの堅牢性モデル抽出攻撃 2024.03.11 2025.04.03 文献データベース
Watermark Stealing in Large Language Models Authors: Nikola Jovanović, Robin Staab, Martin Vechev | Published: 2024-02-29 | Updated: 2024-06-24 モデル抽出攻撃大規模言語モデル攻撃の分類 2024.02.29 2025.04.03 文献データベース
Stealing the Invisible: Unveiling Pre-Trained CNN Models through Adversarial Examples and Timing Side-Channels Authors: Shubhi Shukla, Manaar Alam, Pabitra Mitra, Debdeep Mukhopadhyay | Published: 2024-02-19 モデル抽出攻撃分類パターン分析敵対的サンプル 2024.02.19 2025.04.03 文献データベース
Evaluating Efficacy of Model Stealing Attacks and Defenses on Quantum Neural Networks Authors: Satwik Kundu, Debarshi Kundu, Swaroop Ghosh | Published: 2024-02-18 データセット生成モデル抽出攻撃防御手法 2024.02.18 2025.04.03 文献データベース
SAME: Sample Reconstruction against Model Extraction Attacks Authors: Yi Xie, Jie Zhang, Shiqian Zhao, Tianwei Zhang, Xiaofeng Chen | Published: 2023-12-17 | Updated: 2024-01-08 ウォーターマーキングモデル性能評価モデル抽出攻撃 2023.12.17 2025.04.03 文献データベース
Model Extraction Attacks Revisited Authors: Jiacheng Liang, Ren Pang, Changjiang Li, Ting Wang | Published: 2023-12-08 サイバー攻撃モデル抽出攻撃敵対的攻撃 2023.12.08 2025.04.03 文献データベース
SecurityNet: Assessing Machine Learning Vulnerabilities on Public Models Authors: Boyang Zhang, Zheng Li, Ziqing Yang, Xinlei He, Michael Backes, Mario Fritz, Yang Zhang | Published: 2023-10-19 メンバーシップ推論モデル抽出攻撃攻撃の評価 2023.10.19 2025.04.03 文献データベース