Optimizing Adaptive Attacks against Content Watermarks for Language Models Authors: Abdulrahman Diaa, Toluwani Aremu, Nils Lukas | Published: 2024-10-03 LLMセキュリティウォーターマーキングプロンプトインジェクション 2024.10.03 2025.04.03 文献データベース
A Watermark for Black-Box Language Models Authors: Dara Bahri, John Wieting, Dana Alon, Donald Metzler | Published: 2024-10-02 LLM性能評価ウォーターマーキング透かし評価 2024.10.02 2025.04.03 文献データベース
Inspection and Control of Self-Generated-Text Recognition Ability in Llama3-8b-Instruct Authors: Christopher Ackerman, Nina Panickssery | Published: 2024-10-02 | Updated: 2025-01-25 AIによる出力の識別プロンプティング戦略自己認識モデル 2024.10.02 2025.04.03 文献データベース
Impact of White-Box Adversarial Attacks on Convolutional Neural Networks Authors: Rakesh Podder, Sudipto Ghosh | Published: 2024-10-02 モデル性能評価攻撃手法敵対的サンプル 2024.10.02 2025.04.03 文献データベース
Adaptively Private Next-Token Prediction of Large Language Models Authors: James Flemings, Meisam Razaviyayn, Murali Annavaram | Published: 2024-10-02 プライバシー保護プライバシー保護手法プライバシー手法 2024.10.02 2025.04.03 文献データベース
Social Media Authentication and Combating Deepfakes using Semi-fragile Invisible Image Watermarking Authors: Aakash Varma Nadimpalli, Ajita Rattani | Published: 2024-10-02 ウォーターマーキング透かしの耐久性透かし評価 2024.10.02 2025.04.03 文献データベース
On Using Certified Training towards Empirical Robustness Authors: Alessandro De Palma, Serge Durand, Zakaria Chihani, François Terrier, Caterina Urban | Published: 2024-10-02 | Updated: 2025-03-24 敵対的サンプル正則化 2024.10.02 2025.04.03 文献データベース
Machine Learning-Assisted Intrusion Detection for Enhancing Internet of Things Security Authors: Mona Esmaeili, Morteza Rahimi, Hadise Pishdast, Dorsa Farahmandazad, Matin Khajavi, Hadi Jabbari Saray | Published: 2024-10-01 | Updated: 2024-10-06 サイバーセキュリティネットワーク脅威検出 2024.10.01 2025.04.03 文献データベース
Empirical Perturbation Analysis of Linear System Solvers from a Data Poisoning Perspective Authors: Yixin Liu, Arielle Carr, Lichao Sun | Published: 2024-10-01 バックドア攻撃ポイズニング線形ソルバー 2024.10.01 2025.04.03 文献データベース
Timber! Poisoning Decision Trees Authors: Stefano Calzavara, Lorenzo Cazzaro, Massimo Vettori | Published: 2024-10-01 バックドア攻撃ポイズニング 2024.10.01 2025.04.03 文献データベース