Temporal Context Awareness: A Defense Framework Against Multi-turn Manipulation Attacks on Large Language Models Authors: Prashant Kulkarni, Assaf Namer | Published: 2025-03-18 プロンプトインジェクションプロンプトリーキング攻撃手法 2025.03.18 2025.04.03 文献データベース
Personalized Attacks of Social Engineering in Multi-turn Conversations — LLM Agents for Simulation and Detection Authors: Tharindu Kumarage, Cameron Johnson, Jadie Adams, Lin Ai, Matthias Kirchner, Anthony Hoogs, Joshua Garland, Julia Hirschberg, Arslan Basharat, Huan Liu | Published: 2025-03-18 アライメントソーシャルエンジニアリング攻撃攻撃手法 2025.03.18 2025.04.03 文献データベース
Anomaly-Flow: A Multi-domain Federated Generative Adversarial Network for Distributed Denial-of-Service Detection Authors: Leonardo Henrique de Melo, Gustavo de Carvalho Bertoli, Michele Nogueira, Aldri Luiz dos Santos, Lourenço Alves Pereira Junior | Published: 2025-03-18 サイバー脅威データ生成手法攻撃手法 2025.03.18 2025.04.03 文献データベース
MirrorGuard: Adaptive Defense Against Jailbreaks via Entropy-Guided Mirror Crafting Authors: Rui Pu, Chaozhuo Li, Rui Ha, Litian Zhang, Lirong Qiu, Xi Zhang | Published: 2025-03-17 プロンプトインジェクション大規模言語モデル攻撃手法 2025.03.17 2025.04.03 文献データベース
Prompt Flow Integrity to Prevent Privilege Escalation in LLM Agents Authors: Juhee Kim, Woohyuk Choi, Byoungyoung Lee | Published: 2025-03-17 インダイレクトプロンプトインジェクションデータ流分析攻撃手法 2025.03.17 2025.04.03 文献データベース
BLIA: Detect model memorization in binary classification model through passive Label Inference attack Authors: Mohammad Wahiduzzaman Khan, Sheng Chen, Ilya Mironov, Leizhen Zhang, Rabib Noor | Published: 2025-03-17 データキュレーション差分プライバシー攻撃手法 2025.03.17 2025.04.03 文献データベース
Winning the MIDST Challenge: New Membership Inference Attacks on Diffusion Models for Tabular Data Synthesis Authors: Xiaoyu Wu, Yifei Pang, Terrance Liu, Steven Wu | Published: 2025-03-15 データ生成手法メンバーシップ開示リスク攻撃手法 2025.03.15 2025.04.03 文献データベース
Trust Under Siege: Label Spoofing Attacks against Machine Learning for Android Malware Detection Authors: Tianwei Lan, Luca Demetrio, Farid Nait-Abdesselam, Yufei Han, Simone Aonzo | Published: 2025-03-14 バックドア攻撃ラベル攻撃手法 2025.03.14 2025.04.03 文献データベース
Siege: Autonomous Multi-Turn Jailbreaking of Large Language Models with Tree Search Authors: Andy Zhou | Published: 2025-03-13 | Updated: 2025-03-16 LLMの安全機構の解除攻撃手法生成モデル 2025.03.13 2025.04.03 文献データベース
Mind the Gap: Detecting Black-box Adversarial Attacks in the Making through Query Update Analysis Authors: Jeonghwan Park, Niall McLaughlin, Ihsen Alouani | Published: 2025-03-04 | Updated: 2025-03-16 攻撃手法敵対的サンプルの検知深層学習 2025.03.04 2025.04.03 文献データベース