Immunity memory-based jailbreak detection: multi-agent adaptive guard for large language models Authors: Jun Leng, Litian Zhang, Xi Zhang | Published: 2025-12-03 プロンプトインジェクションメモリ化メカニズム攻撃検出手法 2025.12.03 文献データベース
The Landscape of Memorization in LLMs: Mechanisms, Measurement, and Mitigation Authors: Alexander Xiong, Xuandong Zhao, Aneesh Pappu, Dawn Song | Published: 2025-07-08 プロンプトリーキングメモリ化メカニズム大規模言語モデル 2025.07.08 文献データベース