Digital Forgetting in Large Language Models: A Survey of Unlearning Methods Authors: Alberto Blanco-Justicia, Najeeb Jebreel, Benet Manzanares, David Sánchez, Josep Domingo-Ferrer, Guillem Collell, Kuan Eeik Tan | Published: 2024-04-02 LLM性能評価プロンプトインジェクション機械学習の忘却 2024.04.02 2025.04.03 文献データベース
Humanizing Machine-Generated Content: Evading AI-Text Detection through Adversarial Attack Authors: Ying Zhou, Ben He, Le Sun | Published: 2024-04-02 LLMセキュリティウォーターマーキング攻撃手法 2024.04.02 2025.04.03 文献データベース
AAA: an Adaptive Mechanism for Locally Differential Private Mean Estimation Authors: Fei Wei, Ergute Bao, Xiaokui Xiao, Yin Yang, Bolin Ding | Published: 2024-04-02 | Updated: 2024-04-03 ウォーターマーキングプライバシー保護手法最適化問題 2024.04.02 2025.04.03 文献データベース
Can Biases in ImageNet Models Explain Generalization? Authors: Paul Gavrikov, Janis Keuper | Published: 2024-04-01 バイアスモデル性能評価透かし評価 2024.04.01 2025.04.03 文献データベース
Privacy Backdoors: Enhancing Membership Inference through Poisoning Pre-trained Models Authors: Yuxin Wen, Leo Marchyok, Sanghyun Hong, Jonas Geiping, Tom Goldstein, Nicholas Carlini | Published: 2024-04-01 バックドア攻撃ポイズニングメンバーシップ推論 2024.04.01 2025.04.03 文献データベース
Machine Unlearning for Traditional Models and Large Language Models: A Short Survey Authors: Yi Xu | Published: 2024-04-01 データプライバシー評価モデル性能評価機械学習の忘却 2024.04.01 2025.04.03 文献データベース
Enhancing Reasoning Capacity of SLM using Cognitive Enhancement Authors: Jonathan Pan, Swee Liang Wong, Xin Wei Chia, Yidi Yuan | Published: 2024-04-01 LLM性能評価モデル性能評価ログ解析手法 2024.04.01 2025.04.03 文献データベース
An incremental hybrid adaptive network-based IDS in Software Defined Networks to detect stealth attacks Authors: Abdullah H Alqahtani | Published: 2024-04-01 オンライン学習侵入検知システム異常検出手法 2024.04.01 2025.04.03 文献データベース
What is in Your Safe Data? Identifying Benign Data that Breaks Safety Authors: Luxi He, Mengzhou Xia, Peter Henderson | Published: 2024-04-01 | Updated: 2024-08-20 データ選択戦略プロンプトインジェクション心理的操作 2024.04.01 2025.04.03 文献データベース
Can LLMs get help from other LLMs without revealing private information? Authors: Florian Hartmann, Duc-Hieu Tran, Peter Kairouz, Victor Cărbune, Blaise Aguera y Arcas | Published: 2024-04-01 | Updated: 2024-04-02 LLMセキュリティプライバシー保護プライバシー保護手法 2024.04.01 2025.04.03 文献データベース