Towards Privacy-Preserving LLM Inference via Collaborative Obfuscation (Technical Report) Authors: Yu Lin, Qizhi Zhang, Wenqiang Ruan, Daode Zhang, Jue Hong, Ye Wu, Hanning Xia, Yunlong Mao, Sheng Zhong | Published: 2026-03-02 LLMの安全機構の解除LLM性能評価差分プライバシー 2026.03.02 文献データベース
Inference-Time Safety For Code LLMs Via Retrieval-Augmented Revision Authors: Manisha Mukherjee, Vincent J. Hellendoorn | Published: 2026-03-02 インダイレクトプロンプトインジェクションセキュリティに関連する知識を活用した手法プロンプトリーキング 2026.03.02 文献データベース
LLM Novice Uplift on Dual-Use, In Silico Biology Tasks Authors: Chen Bo Calvin Zhang, Christina Q. Knight, Nicholas Kruus, Jason Hausenloy, Pedro Medeiros, Nathaniel Li, Aiden Kim, Yury Orlovskiy, Coleman Breen, Bryce Cai, Jasper Götting, Andrew Bo Liu, Samira Nedungadi, Paula Rodriguez, Yannis Yiming He, Mohamed Shaaban, Zifan Wang, Seth Donoughe, Julian Michael | Published: 2026-02-26 LLM性能評価モデル評価手法教育データマイニング 2026.02.26 文献データベース
A Decision-Theoretic Formalisation of Steganography With Applications to LLM Monitoring Authors: Usman Anwar, Julianna Piskorz, David D. Baek, David Africa, Jim Weatherall, Max Tegmark, Christian Schroeder de Witt, Mihaela van der Schaar, David Krueger | Published: 2026-02-26 ウォーターマーキングデータ管理システムモデル評価手法 2026.02.26 文献データベース
Assessing Deanonymization Risks with Stylometry-Assisted LLM Agent Authors: Boyang Zhang, Yang Zhang | Published: 2026-02-26 LLMの安全機構の解除データプライバシー評価プロンプトリーキング 2026.02.26 文献データベース
Obscure but Effective: Classical Chinese Jailbreak Prompt Optimization via Bio-Inspired Search Authors: Xun Huang, Simeng Qin, Xiaoshuang Jia, Ranjie Duan, Huanqian Yan, Zhitao Zeng, Fei Yang, Yang Liu, Xiaojun Jia | Published: 2026-02-26 プロンプトインジェクション大規模言語モデル脱獄手法 2026.02.26 文献データベース
AgentSentry: Mitigating Indirect Prompt Injection in LLM Agents via Temporal Causal Diagnostics and Context Purification Authors: Tian Zhang, Yiwei Xu, Juan Wang, Keyan Guo, Xiaoyang Xu, Bowen Xiao, Quanlong Guan, Jinlin Fan, Jiawei Liu, Zhiquan Liu, Hongxin Hu | Published: 2026-02-26 インダイレクトプロンプトインジェクションカウンターファクチュアル説明データ管理システム 2026.02.26 文献データベース
IMMACULATE: A Practical LLM Auditing Framework via Verifiable Computation Authors: Yanpei Guo, Wenjie Qu, Linyu Wu, Shengfang Zhai, Lionel Z. Wang, Ming Xu, Yue Liu, Binhang Yuan, Dawn Song, Jiaheng Zhang | Published: 2026-02-26 LLM性能評価モデル評価手法監査手法 2026.02.26 文献データベース
Layer-Targeted Multilingual Knowledge Erasure in Large Language Models Authors: Taoran Li, Varun Chandrasekaran, Zhiyuan Yu | Published: 2026-02-26 アライメントマシン・アンラーニング機械学習手法 2026.02.26 文献データベース
APFuzz: Towards Automatic Greybox Protocol Fuzzing Authors: Yu Wang, Yang Xiang, Chandra Thapa, Hajime Suzuki | Published: 2026-02-25 プロトコルファジングプロンプトインジェクション研究方法論 2026.02.25 文献データベース