SecurityNet: Assessing Machine Learning Vulnerabilities on Public Models Authors: Boyang Zhang, Zheng Li, Ziqing Yang, Xinlei He, Michael Backes, Mario Fritz, Yang Zhang | Published: 2023-10-19 メンバーシップ推論モデル抽出攻撃攻撃の評価 2023.10.19 2025.04.03 文献データベース
Attack Prompt Generation for Red Teaming and Defending Large Language Models Authors: Boyi Deng, Wenjie Wang, Fuli Feng, Yang Deng, Qifan Wang, Xiangnan He | Published: 2023-10-19 プロンプトインジェクション攻撃の評価敵対的サンプル 2023.10.19 2025.04.03 文献データベース
Last One Standing: A Comparative Analysis of Security and Privacy of Soft Prompt Tuning, LoRA, and In-Context Learning Authors: Rui Wen, Tianhao Wang, Michael Backes, Yang Zhang, Ahmed Salem | Published: 2023-10-17 プライバシー手法モデル抽出攻撃攻撃の評価 2023.10.17 2025.04.03 文献データベース
BufferSearch: Generating Black-Box Adversarial Texts With Lower Queries Authors: Wenjie Lv, Zhen Wang, Yitao Zheng, Zhehua Zhong, Qi Xuan, Tianyi Chen | Published: 2023-10-14 攻撃の評価敵対的サンプル最適化手法 2023.10.14 2025.04.03 文献データベース
On the Feasibility of Cross-Language Detection of Malicious Packages in npm and PyPI Authors: Piergiorgio Ladisa, Serena Elisa Ponta, Nicola Ronzoni, Matias Martinez, Olivier Barais | Published: 2023-10-14 悪意のあるパッケージ検出攻撃の評価特徴選択手法 2023.10.14 2025.04.03 文献データベース
Catastrophic Jailbreak of Open-source LLMs via Exploiting Generation Authors: Yangsibo Huang, Samyak Gupta, Mengzhou Xia, Kai Li, Danqi Chen | Published: 2023-10-10 プロンプトインジェクション攻撃の評価敵対的攻撃 2023.10.10 2025.04.03 文献データベース
Test-Time Poisoning Attacks Against Test-Time Adaptation Models Authors: Tianshuo Cong, Xinlei He, Yun Shen, Yang Zhang | Published: 2023-08-16 ポイズニングモデル性能評価攻撃の評価 2023.08.16 2025.04.03 文献データベース
Diff-CAPTCHA: An Image-based CAPTCHA with Security Enhanced by Denoising Diffusion Model Authors: Ran Jiang, Sanfeng Zhang, Linfeng Liu, Yanbing Peng | Published: 2023-08-16 セキュリティ保証攻撃の評価透かしの耐久性 2023.08.16 2025.04.03 文献データベース
Understanding Multi-Turn Toxic Behaviors in Open-Domain Chatbots Authors: Bocheng Chen, Guangjing Wang, Hanqing Guo, Yuanda Wang, Qiben Yan | Published: 2023-07-14 プロンプトインジェクション対話システム攻撃の評価 2023.07.14 2025.04.03 文献データベース
Group-based Robustness: A General Framework for Customized Robustness in the Real World Authors: Weiran Lin, Keane Lucas, Neo Eyal, Lujo Bauer, Michael K. Reiter, Mahmood Sharif | Published: 2023-06-29 | Updated: 2024-03-10 グループベースの堅牢性攻撃の評価敵対的攻撃検出 2023.06.29 2025.04.03 文献データベース