Not All Tokens Are Created Equal: Query-Efficient Jailbreak Fuzzing for LLMs Authors: Wenyu Chen, Xiangtao Meng, Chuanchao Zang, Li Wang, Xinyu Gao, Jianing Wang, Peng Zhan, Zheng Li, Shanqing Guo | Published: 2026-03-24 LLM性能評価プロンプトインジェクション評価手法 2026.03.24 文献データベース
Robust Safety Monitoring of Language Models via Activation Watermarking Authors: Toluwani Aremu, Daniil Ognev, Samuele Poppi, Nils Lukas | Published: 2026-03-24 ウォーターマーキングデータ生成の安全性プロンプトインジェクション 2026.03.24 文献データベース
A Critical Review on the Effectiveness and Privacy Threats of Membership Inference Attacks Authors: Najeeb Jebreel, David Sánchez, Josep Domingo-Ferrer | Published: 2026-03-24 プライバシー漏洩メンバーシップ推論評価手法 2026.03.24 文献データベース
Beyond Theoretical Bounds: Empirical Privacy Loss Calibration for Text Rewriting Under Local Differential Privacy Authors: Weijun Li, Arnaud Grivet Sébert, Qiongkai Xu, Annabelle McIver, Mark Dras | Published: 2026-03-24 データセット評価差分プライバシー評価手法 2026.03.24 文献データベース
Privacy-Preserving EHR Data Transformation via Geometric Operators: A Human-AI Co-Design Technical Report Authors: Maolin Wang, Beining Bao, Gan Yuan, Hongyu Chen, Bingkun Zhao, Baoshuo Kan, Jiming Xu, Qi Shi, Yinggong Zhao, Yao Wang, Wei Ying Ma, Jun Yan | Published: 2026-03-24 データプライバシー評価プライバシー漏洩評価手法 2026.03.24 文献データベース
SoK: The Attack Surface of Agentic AI — Tools, and Autonomy Authors: Ali Dehghantanha, Sajad Homayoun | Published: 2026-03-24 RAGRAGへのポイズニング攻撃リスク管理 2026.03.24 文献データベース
Explainable Threat Attribution for IoT Networks Using Conditional SHAP and Flow Behavior Modelling Authors: Samuel Ozechi, Jennifer Okonkwoabutu | Published: 2026-03-24 モデルDoS特徴抽出脅威アクター支援 2026.03.24 文献データベース
CIPL: A Target-Independent Framework for Channel-Inversion Privacy Leakage in Agents Authors: Tao Huang, Chen Hou, Jiayang Meng | Published: 2026-03-24 プライバシー漏洩モデルインバージョン評価手法 2026.03.24 文献データベース
Does Teaming-Up LLMs Improve Secure Code Generation? A Comprehensive Evaluation with Multi-LLMSecCodeEval Authors: Bushra Sabir, Shigang Liu, Seung Ick Jang, Sharif Abuadbba, Yansong Gao, Kristen Moore, SangCheol Kim, Hyoungshick Kim, Surya Nepal | Published: 2026-03-24 LLM性能評価モデルDoS敵対的学習 2026.03.24 文献データベース
Structured Visual Narratives Undermine Safety Alignment in Multimodal Large Language Models Authors: Rui Yang Tan, Yujia Hu, Roy Ka-Wei Lee | Published: 2026-03-23 マルチモーダル安全性大規模言語モデル評価手法 2026.03.23 文献データベース