In-Context Probing for Membership Inference in Fine-Tuned Language Models Authors: Zhexi Lu, Hongliang Chi, Nathalie Baracaldo, Swanand Ravindra Kadhe, Yuseok Jeon, Lei Yu | Published: 2025-12-18 AIによる出力のバイアスの検出プライバシー保護機械学習プロンプトリーキング 2025.12.18 文献データベース
ContextLeak: Auditing Leakage in Private In-Context Learning Methods Authors: Jacob Choi, Shuying Cao, Xingjian Dong, Wang Bill Zhu, Robin Jia, Sai Praneeth Karimireddy | Published: 2025-12-18 データ漏洩プライバシー保護機械学習プロンプトリーキング 2025.12.18 文献データベース
PerProb: Indirectly Evaluating Memorization in Large Language Models Authors: Yihan Liao, Jacky Keung, Xiaoxue Ma, Jingyu Zhang, Yicheng Sun | Published: 2025-12-16 インダイレクトプロンプトインジェクションプライバシー保護フレームワークプロンプトリーキング 2025.12.16 文献データベース
On the Effectiveness of Membership Inference in Targeted Data Extraction from Large Language Models Authors: Ali Al Sahili, Ali Chehab, Razane Tajeddine | Published: 2025-12-15 データ抽出と分析プロンプトリーキング評価メトリクス 2025.12.15 文献データベース
CTIGuardian: A Few-Shot Framework for Mitigating Privacy Leakage in Fine-Tuned LLMs Authors: Shashie Dilhara Batan Arachchige, Benjamin Zi Hao Zhao, Hassan Jameel Asghar, Dinusha Vatsalan, Dali Kaafar | Published: 2025-12-15 トレードオフ分析プライバシー保護手法プロンプトリーキング 2025.12.15 文献データベース
Chasing Shadows: Pitfalls in LLM Security Research Authors: Jonathan Evertz, Niklas Risse, Nicolai Neuer, Andreas Müller, Philipp Normann, Gaetano Sapia, Srishti Gupta, David Pape, Soumya Shaw, Devansh Srivastav, Christian Wressnegger, Erwin Quiring, Thorsten Eisenhofer, Daniel Arp, Lea Schönherr | Published: 2025-12-10 データリークやモデルの問題に関する分析を反映した新規ラベルプロンプトインジェクションプロンプトリーキング 2025.12.10 文献データベース
In-Context Representation Hijacking Authors: Itay Yona, Amir Sarid, Michael Karasik, Yossi Gandelsman | Published: 2025-12-03 サイバーセキュリティプロンプトインジェクションプロンプトリーキング 2025.12.03 文献データベース
CryptoQA: A Large-scale Question-answering Dataset for AI-assisted Cryptography Authors: Mayar Elfares, Pascal Reisert, Tilman Dietz, Manpa Barman, Ahmed Zaki, Ralf Küsters, Andreas Bulling | Published: 2025-12-02 データセット生成プロンプトインジェクションプロンプトリーキング 2025.12.02 文献データベース
COGNITION: From Evaluation to Defense against Multimodal LLM CAPTCHA Solvers Authors: Junyu Wang, Changjia Zhu, Yuanbo Zhou, Lingyao Li, Xu He, Junjie Xiong | Published: 2025-12-02 プロンプトリーキングモデル性能評価モデル抽出攻撃 2025.12.02 文献データベース
LLM-CSEC: Empirical Evaluation of Security in C/C++ Code Generated by Large Language Models Authors: Muhammad Usman Shahid, Chuadhry Mujeeb Ahmed, Rajiv Ranjan | Published: 2025-11-24 サイバーセキュリティの自動化プロンプトリーキングリスク評価手法 2025.11.24 文献データベース