David vs. Goliath: Verifiable Agent-to-Agent Jailbreaking via Reinforcement Learning Authors: Samuel Nellessen, Tal Kachman | Published: 2026-02-02 インダイレクトプロンプトインジェクションマルチターン攻撃分析強化学習攻撃 2026.02.02 文献データベース
NeuroFilter: Privacy Guardrails for Conversational LLM Agents Authors: Saswat Das, Ferdinando Fioretto | Published: 2026-01-21 プライバシー保護プロンプトインジェクションマルチターン攻撃分析 2026.01.21 文献データベース
Let the Bees Find the Weak Spots: A Path Planning Perspective on Multi-Turn Jailbreak Attacks against LLMs Authors: Yize Liu, Yunyun Hou, Aina Sui | Published: 2025-11-05 サイバーセキュリティの自動化プロンプトインジェクションマルチターン攻撃分析 2025.11.05 文献データベース