Whisper Leak: a side-channel attack on Large Language Models Authors: Geoff McDonald, Jonathan Bar Or | Published: 2025-11-05 トラフィック特性分析プロンプトリーキング大規模言語モデル 2025.11.05 文献データベース
Watermarking Large Language Models in Europe: Interpreting the AI Act in Light of Technology Authors: Thomas Souverain | Published: 2025-11-05 生成AI向け電子透かし生成モデル特性透明性と検証 2025.11.05 文献データベース
Let the Bees Find the Weak Spots: A Path Planning Perspective on Multi-Turn Jailbreak Attacks against LLMs Authors: Yize Liu, Yunyun Hou, Aina Sui | Published: 2025-11-05 サイバーセキュリティの自動化プロンプトインジェクションマルチターン攻撃分析 2025.11.05 文献データベース
Auditing M-LLMs for Privacy Risks: A Synthetic Benchmark and Evaluation Framework Authors: Junhao Li, Jiahao Chen, Zhou Feng, Chunyi Zhou | Published: 2025-11-05 ハルシネーションプライバシー侵害プライバシー保護 2025.11.05 文献データベース
Death by a Thousand Prompts: Open Model Vulnerability Analysis Authors: Amy Chang, Nicholas Conley, Harish Santhanalakshmi Ganesan, Adam Swanda | Published: 2025-11-05 LLMの安全機構の解除インダイレクトプロンプトインジェクション脅威モデリング 2025.11.05 文献データベース
Measuring the Security of Mobile LLM Agents under Adversarial Prompts from Untrusted Third-Party Channels Authors: Chenghao Du, Quanfeng Huang, Tingxuan Tang, Zihao Wang, Adwait Nadkarni, Yue Xiao | Published: 2025-10-31 | Updated: 2025-11-06 インダイレクトプロンプトインジェクションプロンプトインジェクション情報セキュリティ 2025.10.31 文献データベース
PVMark: Enabling Public Verifiability for LLM Watermarking Schemes Authors: Haohua Duan, Liyao Xiang, Xin Zhang | Published: 2025-10-30 モデル抽出攻撃公的検証可能性透かし技術 2025.10.30 文献データベース
ALMGuard: Safety Shortcuts and Where to Find Them as Guardrails for Audio-Language Models Authors: Weifei Jin, Yuxin Cao, Junjie Su, Minhui Xue, Jie Hao, Ke Xu, Jin Song Dong, Derui Wang | Published: 2025-10-30 プロンプトインジェクション一般化の影響倫理基準遵守 2025.10.30 文献データベース
Model Inversion Attacks Meet Cryptographic Fuzzy Extractors Authors: Mallika Prabhakar, Louise Xu, Prateek Saxena | Published: 2025-10-29 メンバーシップ推論モデルインバージョン防御手法 2025.10.29 文献データベース
Spectral Perturbation Bounds for Low-Rank Approximation with Applications to Privacy Authors: Phuc Tran, Nisheeth K. Vishnoi, Van H. Vu | Published: 2025-10-29 プライバシー保護アルゴリズム計算効率関数境界ペア形成 2025.10.29 文献データベース