文献データベース

Exploring and Developing a Pre-Model Safeguard with Draft Models

Authors: Hongyu Cai, Arjun Arunasalam, Yiming Liang, Antonio Bianchi, Z. Berkay Celik | Published: 2026-05-19
LLMセキュリティ
プロンプトインジェクション
大規模言語モデル

Quantum Machine Learning for Cyber-Physical Anomaly Detection in Unmanned Aerial Vehicles: A Leakage-Free Evaluation with Proxy-Audited Feature Sets

Authors: Carlos A. Durán Paredes, Javier E. León Calderón, Nicolás Sánchez Perea, German Darío Díaz, Camilo Segura Quintero | Published: 2026-05-19
UAV個体識別
データセット評価
量子機械学習

MetaBackdoor: Exploiting Positional Encoding as a Backdoor Attack Surface in LLMs

Authors: Rui Wen, Mark Russinovich, Andrew Paverd, Jun Sakuma, Ahmed Salem | Published: 2026-05-14
LLMセキュリティ
データ漏洩
バックドアモデルの検知

PickleFuzzer: A Case Study in Fuzzing for Discrepancies Between Python Pickle Implementations

Authors: Justin Applegate, Andreas Kellas | Published: 2026-05-14
データオブジェクト
データ保護手法
透かし設計

Toward Securing AI Agents Like Operating Systems

Authors: Lukas Pirch, Micha Horlboge, Patrick Großmann, Syeda Mahnur Asif, Klim Kireev, Thorsten Holz, Konrad Rieck | Published: 2026-05-14
LLMセキュリティ
インダイレクトプロンプトインジェクション
データ保護手法

EVA: Editing for Versatile Alignment against Jailbreaks

Authors: Yi Wang, Hongye Qiu, Yue Xu, Sibei Yang, Zhan Qin, Minlie Huang, Wenjie Wang | Published: 2026-05-14
LLMセキュリティ
モデルDoS
安全性に関連するマルチモーダルなアプローチ

Defenses at Odds: Measuring and Explaining Defense Conflicts in Large Language Models

Authors: Xiangtao Meng, Wenyu Chen, Chuanchao Zang, Xinyu Gao, Jianing Wang, Li Wang, Zheng Li, Shanqing Guo | Published: 2026-05-14
AIによる出力のバイアスの検出
データ保護手法
モデルDoS

Exploiting LLM Agent Supply Chains via Payload-less Skills

Authors: Xinyu Liu, Yukai Zhao, Xing Hu, Xin Xia | Published: 2026-05-14
LLMセキュリティ
インダイレクトプロンプトインジェクション
攻撃手法

Watermarking Game-Playing Agents in Perfect-Information Extensive-Form Games

Authors: Juho Kim, Fei Fang, Tuomas Sandholm | Published: 2026-05-14
生成AI向け電子透かし
行動解析手法
透かし設計

Identifying AI Web Scrapers Using Canary Tokens

Authors: Steven Seiden, Triss Ren, Caroline Zhang, Taein Kim, Enze Liu, Emily Wenger | Published: 2026-05-13
LLMセキュリティ
データ抽出と分析
ユーザー行動分析