PromptLocate: Localizing Prompt Injection Attacks Authors: Yuqi Jia, Yupei Liu, Zedian Shao, Jinyuan Jia, Neil Gong | Published: 2025-10-14 プロンプトの検証大規模言語モデル評価指標 2025.10.14 文献データベース
Sy-FAR: Symmetry-based Fair Adversarial Robustness Authors: Haneen Najjar, Eyal Ronen, Mahmood Sharif | Published: 2025-09-16 公平性の確保敵対的学習評価指標 2025.09.16 文献データベース
Jailbreaking Large Language Models Through Content Concretization Authors: Johan Wahréus, Ahmed Hussain, Panos Papadimitratos | Published: 2025-09-16 プロンプトインジェクションモデル評価評価指標 2025.09.16 文献データベース
Unsupervised anomaly detection on cybersecurity data streams: a case with BETH dataset Authors: Evgeniy Eremin | Published: 2025-03-06 | Updated: 2025-06-16 サイバーセキュリティパフォーマンス評価評価指標 2025.03.06 文献データベース
Deceptive Fairness Attacks on Graphs via Meta Learning Authors: Jian Kang, Yinglong Xia, Ross Maciejewski, Jiebo Luo, Hanghang Tong | Published: 2023-10-24 GNN攻撃手法評価指標 2023.10.24 2025.04.03 文献データベース
Revisiting Transferable Adversarial Images: Systemization, Evaluation, and New Insights Authors: Zhengyu Zhao, Hanwei Zhang, Renjue Li, Ronan Sicre, Laurent Amsaleg, Michael Backes, Qi Li, Qian Wang, Chao Shen | Published: 2023-10-18 | Updated: 2025-09-16 モデルインバージョン敵対的学習評価指標 2023.10.18 文献データベース
Private Synthetic Data Meets Ensemble Learning Authors: Haoyuan Sun, Navid Azizan, Akash Srivastava, Hao Wang | Published: 2023-10-15 データ生成プライバシー保護手法評価指標 2023.10.15 2025.04.03 文献データベース
AGIR: Automating Cyber Threat Intelligence Reporting with Natural Language Generation Authors: Filippo Perrina, Francesco Marchiori, Mauro Conti, Nino Vincenzo Verde | Published: 2023-10-04 データ生成脅威モデリング評価指標 2023.10.04 2025.04.03 文献データベース
Jailbreaker in Jail: Moving Target Defense for Large Language Models Authors: Bocheng Chen, Advait Paliwal, Qiben Yan | Published: 2023-10-03 LLM性能評価プロンプトインジェクション評価指標 2023.10.03 2025.04.03 文献データベース
Beyond Labeling Oracles: What does it mean to steal ML models? Authors: Avital Shafran, Ilia Shumailov, Murat A. Erdogdu, Nicolas Papernot | Published: 2023-10-03 | Updated: 2024-06-13 データ収集知識抽出手法評価指標 2023.10.03 2025.04.03 文献データベース