Obscure but Effective: Classical Chinese Jailbreak Prompt Optimization via Bio-Inspired Search Authors: Xun Huang, Simeng Qin, Xiaoshuang Jia, Ranjie Duan, Huanqian Yan, Zhitao Zeng, Fei Yang, Yang Liu, Xiaojun Jia | Published: 2026-02-26 プロンプトインジェクション大規模言語モデル脱獄手法 2026.02.26 文献データベース
AgentSentry: Mitigating Indirect Prompt Injection in LLM Agents via Temporal Causal Diagnostics and Context Purification Authors: Tian Zhang, Yiwei Xu, Juan Wang, Keyan Guo, Xiaoyang Xu, Bowen Xiao, Quanlong Guan, Jinlin Fan, Jiawei Liu, Zhiquan Liu, Hongxin Hu | Published: 2026-02-26 インダイレクトプロンプトインジェクションカウンターファクチュアル説明データ管理システム 2026.02.26 文献データベース
IMMACULATE: A Practical LLM Auditing Framework via Verifiable Computation Authors: Yanpei Guo, Wenjie Qu, Linyu Wu, Shengfang Zhai, Lionel Z. Wang, Ming Xu, Yue Liu, Binhang Yuan, Dawn Song, Jiaheng Zhang | Published: 2026-02-26 LLM性能評価モデル評価手法監査手法 2026.02.26 文献データベース
Layer-Targeted Multilingual Knowledge Erasure in Large Language Models Authors: Taoran Li, Varun Chandrasekaran, Zhiyuan Yu | Published: 2026-02-26 アライメントマシン・アンラーニング機械学習手法 2026.02.26 文献データベース
APFuzz: Towards Automatic Greybox Protocol Fuzzing Authors: Yu Wang, Yang Xiang, Chandra Thapa, Hajime Suzuki | Published: 2026-02-25 プロトコルファジングプロンプトインジェクション研究方法論 2026.02.25 文献データベース
Private and Robust Contribution Evaluation in Federated Learning Authors: Delio Jaramillo Velez, Gergely Biczok, Alexandre Graell i Amat, Johan Ostman, Balazs Pejo | Published: 2026-02-25 プライバシー評価貢献評価手法連合学習 2026.02.25 文献データベース
Breaking Semantic-Aware Watermarks via LLM-Guided Coherence-Preserving Semantic Injection Authors: Zheng Gao, Xiaoyu Li, Zhicheng Bao, Xiaoyan Feng, Jiaojiao Jiang | Published: 2026-02-25 ウォーターマーキングテキスト生成手法機械学習技術 2026.02.25 文献データベース
The LLMbda Calculus: AI Agents, Conversations, and Information Flow Authors: Zac Garby, Andrew D. Gordon, David Sands | Published: 2026-02-23 インダイレクトプロンプトインジェクションセキュリティ分析手法データ流分析 2026.02.23 文献データベース
Can You Tell It’s AI? Human Perception of Synthetic Voices in Vishing Scenarios Authors: Zoha Hayat Bhatti, Bakhtawar Ahtisham, Seemal Tausif, Niklas George, Nida ul Habib Bajwa, Mobin Javed | Published: 2026-02-23 フィッシング認知バイアス音声データ処理システム 2026.02.23 文献データベース
RobPI: Robust Private Inference against Malicious Client Authors: Jiaqi Xue, Mengxin Zheng, Qian Lou | Published: 2026-02-23 モデル抽出攻撃敵対的学習防御メカニズム 2026.02.23 文献データベース