Rényi Pufferfish Privacy: General Additive Noise Mechanisms and Privacy Amplification by Iteration Authors: Clément Pierquin, Aurélien Bellet, Marc Tommasi, Matthieu Boussard | Published: 2023-12-21 | Updated: 2024-06-10 ウォーターマーキングプライバシー保護手法透かし評価 2023.12.21 2025.04.03 文献データベース
Rethinking Robustness of Model Attributions Authors: Sandesh Kamath, Sankalp Mittal, Amit Deshpande, Vineeth N Balasubramanian | Published: 2023-12-16 ロバスト性評価透かしの耐久性透かし評価 2023.12.16 2025.04.03 文献データベース
Silent Guardian: Protecting Text from Malicious Exploitation by Large Language Models Authors: Jiawei Zhao, Kejiang Chen, Xiaojian Yuan, Yuang Qi, Weiming Zhang, Nenghai Yu | Published: 2023-12-15 | Updated: 2024-10-10 プライバシー保護手法プロンプトインジェクション透かし評価 2023.12.15 2025.04.03 文献データベース
Unsupervised and Supervised learning by Dense Associative Memory under replica symmetry breaking Authors: Linda Albanese, Andrea Alessandrelli, Alessia Annibale, Adriano Barra | Published: 2023-12-15 収束特性透かしの耐久性透かし評価 2023.12.15 2025.04.03 文献データベース
Data-Free Hard-Label Robustness Stealing Attack Authors: Xiaojian Yuan, Kejiang Chen, Wen Huang, Jie Zhang, Weiming Zhang, Nenghai Yu | Published: 2023-12-10 | Updated: 2023-12-12 ウォーターマーキングロバスト性評価透かし評価 2023.12.10 2025.04.03 文献データベース
Provable Adversarial Robustness for Group Equivariant Tasks: Graphs, Point Clouds, Molecules, and More Authors: Jan Schuchardt, Yan Scholten, Stephan Günnemann | Published: 2023-12-05 | Updated: 2024-01-15 ロバスト性評価透かしの耐久性透かし評価 2023.12.05 2025.04.03 文献データベース
Tree of Attacks: Jailbreaking Black-Box LLMs Automatically Authors: Anay Mehrotra, Manolis Zampetakis, Paul Kassianik, Blaine Nelson, Hyrum Anderson, Yaron Singer, Amin Karbasi | Published: 2023-12-04 | Updated: 2024-10-31 クエリ生成手法プロンプトインジェクション透かし評価 2023.12.04 2025.04.03 文献データベース
FRAUDability: Estimating Users’ Susceptibility to Financial Fraud Using Adversarial Machine Learning Authors: Chen Doytshman, Satoru Momiyama, Inderjeet Singh, Yuval Elovici, Asaf Shabtai | Published: 2023-12-02 ウォーターマーキング不正取引透かし評価 2023.12.02 2025.04.03 文献データベース
Deep Unlearning: Fast and Efficient Gradient-free Approach to Class Forgetting Authors: Sangamesh Kodge, Gobinda Saha, Kaushik Roy | Published: 2023-12-01 | Updated: 2024-08-05 ウォーターマーキング機械学習の忘却透かし評価 2023.12.01 2025.04.03 文献データベース
Mark My Words: Analyzing and Evaluating Language Model Watermarks Authors: Julien Piet, Chawin Sitawarin, Vivian Fang, Norman Mu, David Wagner | Published: 2023-12-01 | Updated: 2024-10-11 プロンプトインジェクション透かしの耐久性透かし評価 2023.12.01 2025.04.03 文献データベース