Reconstruction of Differentially Private Text Sanitization via Large Language Models Authors: Shuchao Pang, Zhigang Lu, Haichen Wang, Peng Fu, Yongbin Zhou, Minhui Xue | Published: 2024-10-16 | Updated: 2025-09-18 プライバシー分析プロンプトインジェクションプロンプトリーキング 2024.10.16 文献データベース
The Early Bird Catches the Leak: Unveiling Timing Side Channels in LLM Serving Systems Authors: Linke Song, Zixuan Pang, Wenhao Wang, Zihao Wang, XiaoFeng Wang, Hongbo Chen, Wei Song, Yier Jin, Dan Meng, Rui Hou | Published: 2024-09-30 | Updated: 2025-08-13 セキュリティ保証プロンプトリーキング攻撃戦略分析 2024.09.30 文献データベース
Confidential Prompting: Privacy-preserving LLM Inference on Cloud Authors: Caihua Li, In Gim, Lin Zhong | Published: 2024-09-27 | Updated: 2025-08-25 プロセス分割手法プロンプトリーキングモデル抽出攻撃 2024.09.27 文献データベース
Evading Toxicity Detection with ASCII-art: A Benchmark of Spatial Attacks on Moderation Systems Authors: Sergey Berezin, Reza Farahbakhsh, Noel Crespi | Published: 2024-09-27 | Updated: 2025-09-24 トークン圧縮フレームワークプロンプトリーキング自然言語処理 2024.09.27 文献データベース
Why Are My Prompts Leaked? Unraveling Prompt Extraction Threats in Customized Large Language Models Authors: Zi Liang, Haibo Hu, Qingqing Ye, Yaxin Xiao, Haoyang Li | Published: 2024-08-05 | Updated: 2025-02-12 プロンプトインジェクションプロンプトリーキングモデル評価 2024.08.05 2025.04.03 文献データベース
From Sands to Mansions: Towards Automated Cyberattack Emulation with Classical Planning and Large Language Models Authors: Lingzhi Wang, Zhenyuan Li, Yi Jiang, Zhengkai Wang, Zonghan Guo, Jiahui Wang, Yangyang Wei, Xiangmin Shen, Wei Ruan, Yan Chen | Published: 2024-07-24 | Updated: 2025-04-17 プロンプトリーキング攻撃アクションモデル攻撃検出手法 2024.07.24 文献データベース
ProxyGPT: Enabling User Anonymity in LLM Chatbots via (Un)Trustworthy Volunteer Proxies Authors: Dzung Pham, Jade Sheffey, Chau Minh Pham, Amir Houmansadr | Published: 2024-07-11 | Updated: 2025-06-11 プライバシー保護技術プロンプトインジェクションプロンプトリーキング 2024.07.11 文献データベース
Chain-of-Scrutiny: Detecting Backdoor Attacks for Large Language Models Authors: Xi Li, Ruofan Mao, Yusen Zhang, Renze Lou, Chen Wu, Jiaqi Wang | Published: 2024-06-10 | Updated: 2025-10-30 インダイレクトプロンプトインジェクショントリガーの検知プロンプトリーキング 2024.06.10 文献データベース
Human-Imperceptible Retrieval Poisoning Attacks in LLM-Powered Applications Authors: Quan Zhang, Binqi Zeng, Chijin Zhou, Gwihwan Go, Heyuan Shi, Yu Jiang | Published: 2024-04-26 RAGへのポイズニング攻撃プロンプトリーキングポイズニング 2024.04.26 2025.04.03 文献データベース
Stealing Part of a Production Language Model Authors: Nicholas Carlini, Daniel Paleka, Krishnamurthy Dj Dvijotham, Thomas Steinke, Jonathan Hayase, A. Feder Cooper, Katherine Lee, Matthew Jagielski, Milad Nasr, Arthur Conmy, Itay Yona, Eric Wallace, David Rolnick, Florian Tramèr | Published: 2024-03-11 | Updated: 2024-07-09 プロンプトリーキングモデルの堅牢性モデル抽出攻撃 2024.03.11 2025.04.03 文献データベース