From Defender to Devil? Unintended Risk Interactions Induced by LLM Defenses Authors: Xiangtao Meng, Tianshuo Cong, Li Wang, Wenyu Chen, Zheng Li, Shanqing Guo, Xiaoyun Wang | Published: 2025-10-09 アライメントインダイレクトプロンプトインジェクション防御効果分析 2025.10.09 文献データベース
MetaDefense: Defending Finetuning-based Jailbreak Attack Before and During Generation Authors: Weisen Jiang, Sinno Jialin Pan | Published: 2025-10-09 プロンプトインジェクションロバスト性防御メカニズム 2025.10.09 文献データベース
Rethinking Reasoning: A Survey on Reasoning-based Backdoors in LLMs Authors: Man Hu, Xinyi Wu, Zuofeng Suo, Jinbo Feng, Linghui Meng, Yanhao Jia, Anh Tuan Luu, Shuai Zhao | Published: 2025-10-09 プロンプトリーキング推論に基づくバックドア攻撃防御手法 2025.10.09 文献データベース
Proactive defense against LLM Jailbreak Authors: Weiliang Zhao, Jinjun Peng, Daniel Ben-Levi, Zhou Yu, Junfeng Yang | Published: 2025-10-06 LLMの安全機構の解除プロンプトインジェクション防御手法の統合 2025.10.06 文献データベース
What your brain activity says about you: A review of neuropsychiatric disorders identified in resting-state and sleep EEG data Authors: J. E. M. Scanlon, A. Pelzer, M. Gharleghi, K. C. Fuhrmeister, T. Köllmer, P. Aichroth, R. Göder, C. Hansen, K. I. Wolf | Published: 2025-10-06 プライバシー保護機械学習信号処理医療診断属性 2025.10.06 文献データベース
Federated Computation of ROC and PR Curves Authors: Xuefeng Xu, Graham Cormode | Published: 2025-10-06 トレードオフ分析プライバシー保護機械学習負の入力の近似誤差 2025.10.06 文献データベース
Unified Threat Detection and Mitigation Framework (UTDMF): Combating Prompt Injection, Deception, and Bias in Enterprise-Scale Transformers Authors: Santhosh KumarRavindran | Published: 2025-10-06 インダイレクトプロンプトインジェクションバイアス緩和手法防御手法の統合 2025.10.06 文献データベース
P2P: A Poison-to-Poison Remedy for Reliable Backdoor Defense in LLMs Authors: Shuai Zhao, Xinyi Wu, Shiqian Zhao, Xiaobao Wu, Zhongliang Guo, Yanhao Jia, Anh Tuan Luu | Published: 2025-10-06 プロンプトインジェクションプロンプトの検証防御手法の統合 2025.10.06 文献データベース
Autonomy Matters: A Study on Personalization-Privacy Dilemma in LLM Agents Authors: Zhiping Zhang, Yi Evie Zhang, Freda Shi, Tianshi Li | Published: 2025-10-06 インダイレクトプロンプトインジェクションプライバシー保護機械学習ユーザー活動解析 2025.10.06 文献データベース
Machine Unlearning Meets Adversarial Robustness via Constrained Interventions on LLMs Authors: Fatmazohra Rezkellah, Ramzi Dakhmouche | Published: 2025-10-03 | Updated: 2025-10-15 AIによる出力の識別ロバスト性大規模言語モデル 2025.10.03 文献データベース