LLM Jailbreak Detection for (Almost) Free! Authors: Guorui Chen, Yifan Xia, Xiaojun Jia, Zhijiang Li, Philip Torr, Jindong Gu | Published: 2025-09-18 大規模言語モデル評価手法透かし技術 2025.09.18 文献データベース
BEACON: Behavioral Malware Classification with Large Language Model Embeddings and Deep Learning Authors: Wadduwage Shanika Perera, Haodi Jiang | Published: 2025-09-18 マルウェア検出シナリオ行動解析手法評価手法 2025.09.18 文献データベース
Defending Diffusion Models Against Membership Inference Attacks via Higher-Order Langevin Dynamics Authors: Benjamin Sterling, Yousef El-Laham, Mónica F. Bugallo | Published: 2025-09-17 プライバシー分析拡散モデル生成モデル特性 2025.09.17 文献データベース
Differential Privacy in Federated Learning: Mitigating Inference Attacks with Randomized Response Authors: Ozer Ozturk, Busra Buyuktanir, Gozde Karatas Baydogmus, Kazim Yildiz | Published: 2025-09-17 アルゴリズムプライバシー分析差分プライバシー 2025.09.17 文献データベース
Who Taught the Lie? Responsibility Attribution for Poisoned Knowledge in Retrieval-Augmented Generation Authors: Baolei Zhang, Haoran Xin, Yuxi Chen, Zhuqing Liu, Biao Yi, Tong Li, Lihai Nie, Zheli Liu, Minghong Fang | Published: 2025-09-17 RAGへのポイズニング攻撃評価手法責任帰属システム設計 2025.09.17 文献データベース
Secure UAV-assisted Federated Learning: A Digital Twin-Driven Approach with Zero-Knowledge Proofs Authors: Md Bokhtiar Al Zami, Md Raihan Uddin, Dinh C. Nguyen | Published: 2025-09-17 エネルギー管理デジタルツイン技術連合学習 2025.09.17 文献データベース
Privacy-Aware In-Context Learning for Large Language Models Authors: Bishnu Bhusal, Manoj Acharya, Ramneet Kaur, Colin Samplawski, Anirban Roy, Adam D. Cobb, Rohit Chadha, Susmit Jha | Published: 2025-09-17 差分プライバシー情報抽出透かし 2025.09.17 文献データベース
A Multi-Agent LLM Defense Pipeline Against Prompt Injection Attacks Authors: S M Asif Hossain, Ruksat Khan Shayoni, Mohd Ruhul Ameen, Akif Islam, M. F. Mridha, Jungpil Shin | Published: 2025-09-16 | Updated: 2025-10-01 インダイレクトプロンプトインジェクションプロンプトインジェクション分散型LLMアーキテクチャ 2025.09.16 文献データベース
Sy-FAR: Symmetry-based Fair Adversarial Robustness Authors: Haneen Najjar, Eyal Ronen, Mahmood Sharif | Published: 2025-09-16 公平性の確保敵対的学習評価指標 2025.09.16 文献データベース
Jailbreaking Large Language Models Through Content Concretization Authors: Johan Wahréus, Ahmed Hussain, Panos Papadimitratos | Published: 2025-09-16 プロンプトインジェクションモデル評価評価指標 2025.09.16 文献データベース