Decomposing and Editing Predictions by Modeling Model Computation Authors: Harshay Shah, Andrew Ilyas, Aleksander Madry | Published: 2024-04-17 ウォーターマーキングモデルの解釈性モデル編集手法 2024.04.17 2025.04.03 文献データベース
DEPN: Detecting and Editing Privacy Neurons in Pretrained Language Models Authors: Xinwei Wu, Junzhuo Li, Minghui Xu, Weilong Dong, Shuangzhi Wu, Chao Bian, Deyi Xiong | Published: 2023-10-31 | Updated: 2023-12-05 プライバシー保護手法プライバシー手法モデル編集手法 2023.10.31 2025.04.03 文献データベース
Proof of Unlearning: Definitions and Instantiation Authors: Jiasi Weng, Shenglong Yao, Yuefeng Du, Junjie Huang, Jian Weng, Cong Wang | Published: 2022-10-20 | Updated: 2022-10-21 DNN IP保護手法プライバシーリスク管理モデル編集手法 2022.10.20 2025.04.03 文献データベース