LLM Jailbreak Detection for (Almost) Free! Authors: Guorui Chen, Yifan Xia, Xiaojun Jia, Zhijiang Li, Philip Torr, Jindong Gu | Published: 2025-09-18 大規模言語モデル評価手法透かし技術 2025.09.18 文献データベース
Yet Another Watermark for Large Language Models Authors: Siyuan Bao, Ying Shi, Zhiguang Yang, Hanzhou Wu, Xinpeng Zhang | Published: 2025-09-16 プロンプトリーキング大規模言語モデル透かし技術 2025.09.16 文献データベース
ZKPROV: A Zero-Knowledge Approach to Dataset Provenance for Large Language Models Authors: Mina Namazi, Alexander Nemecek, Erman Ayday | Published: 2025-06-26 プライバシー保護大規模言語モデル透かし技術 2025.06.26 文献データベース
FicGCN: Unveiling the Homomorphic Encryption Efficiency from Irregular Graph Convolutional Networks Authors: Zhaoxuan Kan, Husheng Han, Shangyi Shi, Tenghui Hua, Hang Lu, Xiaowei Li, Jianan Mu, Xing Hu | Published: 2025-06-12 ノード最適化手法プライバシー保護技術透かし技術 2025.06.12 文献データベース
Engineering Trustworthy Machine-Learning Operations with Zero-Knowledge Proofs Authors: Filippo Scaramuzza, Giovanni Quattrocchi, Damian A. Tamburri | Published: 2025-05-26 プライバシー問題モデル評価手法透かし技術 2025.05.26 文献データベース
TrojanStego: Your Language Model Can Secretly Be A Steganographic Privacy Leaking Agent Authors: Dominik Meier, Jan Philip Wahle, Paul Röttger, Terry Ruas, Bela Gipp | Published: 2025-05-26 プロンプトインジェクションモデル抽出攻撃透かし技術 2025.05.26 文献データベース
Differential Privacy Analysis of Decentralized Gossip Averaging under Varying Threat Models Authors: Antti Koskela, Tejas Kulkarni | Published: 2025-05-26 プライバシー問題差分プライバシー透かし技術 2025.05.26 文献データベース
Deconstructing Obfuscation: A four-dimensional framework for evaluating Large Language Models assembly code deobfuscation capabilities Authors: Anton Tkachenko, Dmitrij Suskevic, Benjamin Adolphi | Published: 2025-05-26 モデル評価手法大規模言語モデル透かし技術 2025.05.26 文献データベース
Fixing 7,400 Bugs for 1$: Cheap Crash-Site Program Repair Authors: Han Zheng, Ilia Shumailov, Tianqi Fan, Aiden Hall, Mathias Payer | Published: 2025-05-19 LLMセキュリティバグ修正手法透かし技術 2025.05.19 文献データベース
MUBox: A Critical Evaluation Framework of Deep Machine Unlearning Authors: Xiang Li, Bhavani Thuraisingham, Wenqi Wei | Published: 2025-05-13 クラス別忘却評価毒データの検知透かし技術 2025.05.13 文献データベース