マルチターン攻撃分析

David vs. Goliath: Verifiable Agent-to-Agent Jailbreaking via Reinforcement Learning

Authors: Samuel Nellessen, Tal Kachman | Published: 2026-02-02
インダイレクトプロンプトインジェクション
マルチターン攻撃分析
強化学習攻撃

NeuroFilter: Privacy Guardrails for Conversational LLM Agents

Authors: Saswat Das, Ferdinando Fioretto | Published: 2026-01-21
プライバシー保護
プロンプトインジェクション
マルチターン攻撃分析

Let the Bees Find the Weak Spots: A Path Planning Perspective on Multi-Turn Jailbreak Attacks against LLMs

Authors: Yize Liu, Yunyun Hou, Aina Sui | Published: 2025-11-05
サイバーセキュリティの自動化
プロンプトインジェクション
マルチターン攻撃分析