RLSpoofer: A Lightweight Evaluator for LLM Watermark Spoofing Resilience Authors: Hanbo Huang, Xuan Gong, Yiran Zhang, Hao Zheng, Shiyu Liang | Published: 2026-04-13 攻撃戦略分析敵対的学習透かし設計 2026.04.13 文献データベース
RedShell: A Generative AI-Based Approach to Ethical Hacking Authors: Ricardo Bessa, Rui Claro, João Trindade, João Lourenço | Published: 2026-04-13 LLM性能評価プロンプトインジェクション攻撃戦略分析 2026.04.13 文献データベース
Mobile GUI Agent Privacy Personalization with Trajectory Induced Preference Optimization Authors: Zhixin Lin, Jungang Li, Dongliang Xu, Shidong Pan, Yibo Shi, Yuchi Liu, Yuecong Min, Yue Yao | Published: 2026-04-13 アライメントプライバシー管理透かし設計 2026.04.13 文献データベース
QShield: Securing Neural Networks Against Adversarial Attacks using Quantum Circuits Authors: Navid Azimi, Aditya Prakash, Yao Wang, Li Xiong | Published: 2026-04-13 モデルの頑健性保証透かし設計量子フレームワーク 2026.04.13 文献データベース
Beyond A Fixed Seal: Adaptive Stealing Watermark in Large Language Models Authors: Shuhao Zhang, Yuli Chen, Jiale Han, Bo Cheng, Jiabao Ma | Published: 2026-04-13 モデル抽出攻撃攻撃戦略分析透かし設計 2026.04.13 文献データベース
Vulnerability Detection with Interprocedural Context in Multiple Languages: Assessing Effectiveness and Cost of Modern LLMs Authors: Kevin Lira, Baldoino Fonseca, Davy Baía, Márcio Ribeiro, Wesley K. G. Assunção | Published: 2026-04-09 LLM性能評価データ駆動型脆弱性評価プロンプトインジェクション 2026.04.09 文献データベース
Your Agent Is Mine: Measuring Malicious Intermediary Attacks on the LLM Supply Chain Authors: Hanzhi Liu, Chaofan Shou, Hongbo Wen, Yanju Chen, Ryan Jingyang Fang, Yu Feng | Published: 2026-04-09 インダイレクトプロンプトインジェクションデータ毒性攻撃攻撃戦略分析 2026.04.09 文献データベース
Securing Retrieval-Augmented Generation: A Taxonomy of Attacks, Defenses, and Future Directions Authors: Yuming Xu, Mingtao Zhang, Zhuohan Ge, Haoyang Li, Nicole Hu, Jason Chen Zhang, Qing Li, Lei Chen | Published: 2026-04-09 RAGRAGへのポイズニング攻撃プライバシー管理 2026.04.09 文献データベース
Towards Identification and Intervention of Safety-Critical Parameters in Large Language Models Authors: Weiwei Qi, Zefeng Wu, Tianhang Zheng, Zikang Zhang, Xiaojun Jia, Zhan Qin, Kui Ren | Published: 2026-04-09 プロンプトインジェクションモデル性能評価安全性評価 2026.04.09 文献データベース
The Art of (Mis)alignment: How Fine-Tuning Methods Effectively Misalign and Realign LLMs in Post-Training Authors: Rui Zhang, Hongwei Li, Yun Shen, Xinyue Shen, Wenbo Jiang, Guowen Xu, Yang Liu, Michael Backes, Yang Zhang | Published: 2026-04-09 LLM性能評価出力の有害度の算出安全性評価 2026.04.09 文献データベース