Model-Agnostic Lifelong LLM Safety via Externalized Attack-Defense Co-Evolution Authors: Xiaozhe Zhang, Chaozhuo Li, Hui Liu, Shaocheng Yan, Bingyu Yan, Qiwei Ye, Haoliang Li | Published: 2026-05-13 LLMの安全機構の解除アライメント行動解析手法 2026.05.13 文献データベース
Empowering IoT Security: On-Device Intrusion Detection in Resource Constrained Devices Authors: Vasilis Ieropoulos, Eirini Anthi, Theodoros Spyridopoulos, Pete Burnap, Aftab Khan, Pietro Carnelli | Published: 2026-05-13 IoTサイバーセキュリティデータ保護手法機械学習の応用 2026.05.13 文献データベース
Quantifying LLM Safety Degradation Under Repeated Attacks Using Survival Analysis Authors: Zvi Topol | Published: 2026-05-13 LLMセキュリティプロンプトインジェクション行動解析手法 2026.05.13 文献データベース
Persona-Model Collapse in Emergent Misalignment Authors: Davi Bastos Costa, Renato Vicente | Published: 2026-05-13 データセット評価ユーザー行動分析行動解析手法 2026.05.13 文献データベース
HE-PIM: Demystifying Homomorphic Operations on a Real-world Processing-in-Memory System Authors: Harshita Gupta, Mayank Kabra, Jaewoo Park, Priyam Mehta, Phillip Widdowson, Tathagata Barik, Nisa Bostancı, Konstantinos Kanellopoulos, Juan Gómez-Luna, Antonio J. Peña, Mohammad Sadrosadati, Onur Mutlu | Published: 2026-05-13 効率評価計算複雑性透かし設計 2026.05.13 文献データベース
SoK: Unlearnability and Unlearning for Model Dememorization Authors: Mengying Zhang, Derui Wang, Ruoxi Sun, Xiaoyu Xia, Shuang Hao, Minhui Xue | Published: 2026-05-12 データ保護手法モデルの頑健性保証モデル保護手法 2026.05.12 文献データベース
FlowSteer: Prompt-Only Workflow Steering Exposes Planning-Time Vulnerabilities in Multi-Agent LLM Systems Authors: Fanxiao Li, Jiaying Wu, Tingchao Fu, Natasha Jaques, Wei Zhou, Min-Yen Kan | Published: 2026-05-12 インダイレクトプロンプトインジェクションデータ中心のセキュリティ多エージェントシステムの評価 2026.05.12 文献データベース
CTFusion: A CTF-based Benchmark for LLM Agent Evaluation Authors: Dongjun Lee, Ga-eun Bae, Insu Yun | Published: 2026-05-12 CTF競技信頼性評価欺瞞検出 2026.05.12 文献データベース
Can a Single Message Paralyze the AI Infrastructure? The Rise of AbO-DDoS Attacks through Targeted Mobius Injection Authors: Zi Liang, Ronghua Li, Yanyun Wang, Qingqing Ye, Haibo Hu | Published: 2026-05-12 インダイレクトプロンプトインジェクションユーザー認証システム攻撃の分類 2026.05.12 文献データベース
Threat Modelling using Domain-Adapted Language Models: Empirical Evaluation and Insights Authors: Saba Pourhanifeh, AbdulAziz AbdulGhaffar, Ashraf Matrawy | Published: 2026-05-11 プロンプトインジェクションプロンプトリーキング攻撃の分類 2026.05.11 文献データベース