AIセキュリティポータルbot | ページ 200 | AIセキュリティポータル

Digital Forgetting in Large Language Models: A Survey of Unlearning Methods

Authors: Alberto Blanco-Justicia, Najeeb Jebreel, Benet Manzanares, David Sánchez, Josep Domingo-Ferrer, Guillem Collell, Kuan Eeik Tan | Published: 2024-04-02

LLM性能評価

プロンプトインジェクション

機械学習の忘却

2024.04.02 2025.04.03

文献データベース

Humanizing Machine-Generated Content: Evading AI-Text Detection through Adversarial Attack

Authors: Ying Zhou, Ben He, Le Sun | Published: 2024-04-02

LLMセキュリティ

ウォーターマーキング

攻撃手法

2024.04.02 2025.04.03

文献データベース

AAA: an Adaptive Mechanism for Locally Differential Private Mean Estimation

Authors: Fei Wei, Ergute Bao, Xiaokui Xiao, Yin Yang, Bolin Ding | Published: 2024-04-02 | Updated: 2024-04-03

ウォーターマーキング

プライバシー保護手法

最適化問題

2024.04.02 2025.04.03

文献データベース

Can Biases in ImageNet Models Explain Generalization?

Authors: Paul Gavrikov, Janis Keuper | Published: 2024-04-01

バイアス

モデル性能評価

透かし評価

2024.04.01 2025.04.03

文献データベース

Privacy Backdoors: Enhancing Membership Inference through Poisoning Pre-trained Models

Authors: Yuxin Wen, Leo Marchyok, Sanghyun Hong, Jonas Geiping, Tom Goldstein, Nicholas Carlini | Published: 2024-04-01

バックドア攻撃

ポイズニング

メンバーシップ推論

2024.04.01 2025.04.03

文献データベース

Machine Unlearning for Traditional Models and Large Language Models: A Short Survey

Authors: Yi Xu | Published: 2024-04-01

データプライバシー評価

モデル性能評価

機械学習の忘却

2024.04.01 2025.04.03

文献データベース

Enhancing Reasoning Capacity of SLM using Cognitive Enhancement

Authors: Jonathan Pan, Swee Liang Wong, Xin Wei Chia, Yidi Yuan | Published: 2024-04-01

LLM性能評価

モデル性能評価

ログ解析手法

2024.04.01 2025.04.03

文献データベース

An incremental hybrid adaptive network-based IDS in Software Defined Networks to detect stealth attacks

Authors: Abdullah H Alqahtani | Published: 2024-04-01

オンライン学習

侵入検知システム

異常検出手法

2024.04.01 2025.04.03

文献データベース

What is in Your Safe Data? Identifying Benign Data that Breaks Safety

Authors: Luxi He, Mengzhou Xia, Peter Henderson | Published: 2024-04-01 | Updated: 2024-08-20

データ選択戦略

プロンプトインジェクション

心理的操作

2024.04.01 2025.04.03

文献データベース

Can LLMs get help from other LLMs without revealing private information?

Authors: Florian Hartmann, Duc-Hieu Tran, Peter Kairouz, Victor Cărbune, Blaise Aguera y Arcas | Published: 2024-04-01 | Updated: 2024-04-02

LLMセキュリティ

プライバシー保護

プライバシー保護手法

2024.04.01 2025.04.03

文献データベース