Duwak: Dual Watermarks in Large Language Models Authors: Chaoyi Zhu, Jeroen Galjaard, Pin-Yu Chen, Lydia Y. Chen | Published: 2024-03-12 | Updated: 2024-08-08 ウォーターマーキングトークンの処理と収集透かし評価 2024.03.12 2025.04.03 文献データベース
Robustness bounds on the successful adversarial examples in probabilistic models: Implications from Gaussian processes Authors: Hiroaki Maeshima, Akira Otsuka | Published: 2024-03-04 | Updated: 2025-03-19 攻撃手法敵対的サンプル透かし評価 2024.03.04 2025.04.03 文献データベース
Revisiting Differentially Private Hyper-parameter Tuning Authors: Zihang Xiang, Tianhao Wang, Chenglong Wang, Di Wang | Published: 2024-02-20 | Updated: 2024-06-04 ハイパーパラメータ調整プライバシー保護手法透かし評価 2024.02.20 2025.04.03 文献データベース
Bounding Reconstruction Attack Success of Adversaries Without Data Priors Authors: Alexander Ziller, Anneliese Riess, Kristian Schwethelm, Tamara T. Mueller, Daniel Rueckert, Georgios Kaissis | Published: 2024-02-20 データプライバシー評価プライバシー保護手法透かし評価 2024.02.20 2025.04.03 文献データベース
DART: A Principled Approach to Adversarially Robust Unsupervised Domain Adaptation Authors: Yunjuan Wang, Hussein Hazimeh, Natalia Ponomareva, Alexey Kurakin, Ibrahim Hammoud, Raman Arora | Published: 2024-02-16 アルゴリズム敵対的訓練透かし評価 2024.02.16 2025.04.03 文献データベース
Private PAC Learning May be Harder than Online Learning Authors: Mark Bun, Aloni Cohen, Rathin Desai | Published: 2024-02-16 ウォーターマーキングオンライン学習透かし評価 2024.02.16 2025.04.03 文献データベース
Measuring and Reducing LLM Hallucination without Gold-Standard Answers Authors: Jiaheng Wei, Yuanshun Yao, Jean-Francois Ton, Hongyi Guo, Andrew Estornell, Yang Liu | Published: 2024-02-16 | Updated: 2024-06-06 Few-Shot Learningハルシネーションの検知透かし評価 2024.02.16 2025.04.03 文献データベース
How Much Does Each Datapoint Leak Your Privacy? Quantifying the Per-datum Membership Leakage Authors: Achraf Azize, Debabrota Basu | Published: 2024-02-15 メンバーシップ推論仮説検定透かし評価 2024.02.15 2025.04.03 文献データベース
CycPUF: Cyclic Physical Unclonable Function Authors: Michael Dominguez, Amin Rezaei | Published: 2024-02-12 FPGAPUFの評価手法透かし評価 2024.02.12 2025.04.03 文献データベース
ACW: Enhancing Traceability of AI-Generated Codes Based on Watermarking Authors: Boquan Li, Mengdi Zhang, Peixin Zhang, Jun Sun, Xingmei Wang, Zirui Fu | Published: 2024-02-12 | Updated: 2024-08-21 アルゴリズムウォーターマーキング透かし評価 2024.02.12 2025.04.03 文献データベース