脱獄攻撃手法

SoK: Evaluating Jailbreak Guardrails for Large Language Models

Authors: Xunguang Wang, Zhenlan Ji, Wenxuan Wang, Zongjie Li, Daoyuan Wu, Shuai Wang | Published: 2025-06-12
プロンプトインジェクション
安全性と有用性のトレードオフ
脱獄攻撃手法