Fundamental Limits of Membership Inference Attacks on Machine Learning Models Authors: Eric Aubinais, Elisabeth Gassiat, Pablo Piantanida | Published: 2023-10-20 | Updated: 2024-06-11 メンバーシップ推論敵対的攻撃機械学習手法 2023.10.20 2025.04.03 文献データベース
An LLM can Fool Itself: A Prompt-Based Adversarial Attack Authors: Xilie Xu, Keyi Kong, Ning Liu, Lizhen Cui, Di Wang, Jingfeng Zhang, Mohan Kankanhalli | Published: 2023-10-20 プロンプトインジェクション悪意のあるプロンプト敵対的攻撃 2023.10.20 2025.04.03 文献データベース
On existence, uniqueness and scalability of adversarial robustness measures for AI classifiers Authors: Illia Horenko | Published: 2023-10-19 | Updated: 2023-11-15 敵対的攻撃最適化手法機械学習手法 2023.10.19 2025.04.03 文献データベース
Catastrophic Jailbreak of Open-source LLMs via Exploiting Generation Authors: Yangsibo Huang, Samyak Gupta, Mengzhou Xia, Kai Li, Danqi Chen | Published: 2023-10-10 プロンプトインジェクション攻撃の評価敵対的攻撃 2023.10.10 2025.04.03 文献データベース
Outlier Robust Adversarial Training Authors: Shu Hu, Zhenhuan Yang, Xin Wang, Yiming Ying, Siwei Lyu | Published: 2023-09-10 収束特性損失項敵対的攻撃 2023.09.10 2025.04.03 文献データベース
DAD++: Improved Data-free Test Time Adversarial Defense Authors: Gaurav Kumar Nayak, Inder Khatri, Shubham Randive, Ruchit Rawal, Anirban Chakraborty | Published: 2023-09-10 敵対的サンプル敵対的攻撃防御手法 2023.09.10 2025.04.03 文献データベース
Adversarially Robust Deep Learning with Optimal-Transport-Regularized Divergences Authors: Jeremiah Birrell, Mohammadreza Ebrahimi | Published: 2023-09-07 悪意のあるデモ構築敵対的攻撃防御手法 2023.09.07 2025.04.03 文献データベース
Non-Asymptotic Bounds for Adversarial Excess Risk under Misspecified Models Authors: Changyu Liu, Yuling Jiao, Junhui Wang, Jian Huang | Published: 2023-09-02 収束特性損失項敵対的攻撃 2023.09.02 2025.04.03 文献データベース
The Power of MEME: Adversarial Malware Creation with Model-Based Reinforcement Learning Authors: Maria Rigaki, Sebastian Garcia | Published: 2023-08-31 強化学習悪意のあるデモ構築敵対的攻撃 2023.08.31 2025.04.03 文献データベース
A Comparison of Adversarial Learning Techniques for Malware Detection Authors: Pavla Louthánová, Matouš Kozák, Martin Jureček, Mark Stamp | Published: 2023-08-19 マルウェア検出敵対的サンプル敵対的攻撃 2023.08.19 2025.04.03 文献データベース