PIG: Privacy Jailbreak Attack on LLMs via Gradient-based Iterative In-Context Optimization Authors: Yidan Wang, Yanan Cao, Yubing Ren, Fang Fang, Zheng Lin, Binxing Fang | Published: 2025-05-15 LLMの安全機構の解除プロンプトインジェクション機械学習のプライバシー保護 2025.05.15 文献データベース
Adversarial Suffix Filtering: a Defense Pipeline for LLMs Authors: David Khachaturov, Robert Mullins | Published: 2025-05-14 プロンプトの検証倫理基準遵守攻撃検出手法 2025.05.14 文献データベース
CANTXSec: A Deterministic Intrusion Detection and Prevention System for CAN Bus Monitoring ECU Activations Authors: Denis Donadel, Kavya Balasubramanian, Alessandro Brighente, Bhaskar Ramasubramanian, Mauro Conti, Radha Poovendran | Published: 2025-05-14 テストベッド攻撃検出手法電子制御ユニット 2025.05.14 文献データベース
MorphMark: Flexible Adaptive Watermarking for Large Language Models Authors: Zongqi Wang, Tianle Gu, Baoyuan Wu, Yujiu Yang | Published: 2025-05-14 | Updated: 2025-05-20 テキスト生成手法生成AI向け電子透かし透かしの耐久性 2025.05.14 文献データベース
Evaluating the Robustness of Adversarial Defenses in Malware Detection Systems Authors: Mostafa Jafari, Alireza Shameli-Sendi | Published: 2025-05-14 ロバスト性分析攻撃検出手法敵対的学習 2025.05.14 文献データベース
Instantiating Standards: Enabling Standard-Driven Text TTP Extraction with Evolvable Memory Authors: Cheng Meng, ZhengWei Jiang, QiuYun Wang, XinYi Li, ChunYan Ma, FangMing Dong, FangLi Ren, BaoXu Liu | Published: 2025-05-14 プロンプトリーキング攻撃検出手法知識抽出手法 2025.05.14 文献データベース
Toward Malicious Clients Detection in Federated Learning Authors: Zhihao Dou, Jiaqi Wang, Wei Sun, Zhuqing Liu, Minghong Fang | Published: 2025-05-14 トリガーの検知ポイズニング悪意のあるクライアント検出 2025.05.14 文献データベース
Securing RAG: A Risk Assessment and Mitigation Framework Authors: Lukas Ammann, Sara Ott, Christoph R. Landolt, Marco P. Lehmann | Published: 2025-05-13 LLMセキュリティRAGRAGへのポイズニング攻撃 2025.05.13 文献データベース
MUBox: A Critical Evaluation Framework of Deep Machine Unlearning Authors: Xiang Li, Bhavani Thuraisingham, Wenqi Wei | Published: 2025-05-13 クラス別忘却評価毒データの検知透かし技術 2025.05.13 文献データベース
LibVulnWatch: A Deep Assessment Agent System and Leaderboard for Uncovering Hidden Vulnerabilities in Open-Source AI Libraries Authors: Zekun Wu, Seonglae Cho, Umar Mohammed, Cristian Munoz, Kleyton Costa, Xin Guan, Theo King, Ze Wang, Emre Kazim, Adriano Koshiyama | Published: 2025-05-13 | Updated: 2025-06-30 インダイレクトプロンプトインジェクションリスク評価手法依存関係管理 2025.05.13 文献データベース