適応型誤用検出

Taxonomy, Evaluation and Exploitation of IPI-Centric LLM Agent Defense Frameworks

Authors: Zimo Ji, Xunguang Wang, Zongjie Li, Pingchuan Ma, Yudong Gao, Daoyuan Wu, Xincheng Yan, Tian Tian, Shuai Wang | Published: 2025-11-19

インダイレクトプロンプトインジェクション

プロンプトリーキング

適応型誤用検出

2025.11.19

文献データベース

Authors: Zhengchunmin Dai, Jiaxiong Tang, Peng Sun, Honglong Chen, Liantao Wu | Published: 2025-11-18

堅牢性検証手法

透かし評価

適応型誤用検出

2025.11.18

文献データベース

Authors: JoonHo Lee, HyeonMin Cho, Jaewoong Yun, Hyunjae Lee, JunKyu Lee, Juree Seok | Published: 2025-11-16

プロンプトインジェクション

悪意のあるプロンプト

適応型誤用検出

2025.11.16

文献データベース

Authors: Rafael Uetz, Marco Herzog, Louis Hackländer, Simon Schwarz, Martin Henze | Published: 2023-11-16 | Updated: 2023-12-19

ルール帰属

攻撃手法

適応型誤用検出

2023.11.16 2025.04.03

文献データベース

Authors: Atefeh Mahdavi, Neda Keivandarian, Marco Carvalho | Published: 2023-08-29

テキスト生成手法

敵対的訓練

適応型誤用検出

2023.08.29 2025.04.03

文献データベース

Authors: Senwei Liang, Zhongzhan Huang, Mingfu Liang, Haizhao Yang | Published: 2019-08-12 | Updated: 2019-09-18

トレーニング手法

深層強化学習

適応型誤用検出

2019.08.12 2025.04.03

文献データベース