文献データベース

Model-Agnostic Lifelong LLM Safety via Externalized Attack-Defense Co-Evolution

Authors: Xiaozhe Zhang, Chaozhuo Li, Hui Liu, Shaocheng Yan, Bingyu Yan, Qiwei Ye, Haoliang Li | Published: 2026-05-13
LLMの安全機構の解除
アライメント
行動解析手法

Empowering IoT Security: On-Device Intrusion Detection in Resource Constrained Devices

Authors: Vasilis Ieropoulos, Eirini Anthi, Theodoros Spyridopoulos, Pete Burnap, Aftab Khan, Pietro Carnelli | Published: 2026-05-13
IoTサイバーセキュリティ
データ保護手法
機械学習の応用

Quantifying LLM Safety Degradation Under Repeated Attacks Using Survival Analysis

Authors: Zvi Topol | Published: 2026-05-13
LLMセキュリティ
プロンプトインジェクション
行動解析手法

Persona-Model Collapse in Emergent Misalignment

Authors: Davi Bastos Costa, Renato Vicente | Published: 2026-05-13
データセット評価
ユーザー行動分析
行動解析手法

HE-PIM: Demystifying Homomorphic Operations on a Real-world Processing-in-Memory System

Authors: Harshita Gupta, Mayank Kabra, Jaewoo Park, Priyam Mehta, Phillip Widdowson, Tathagata Barik, Nisa Bostancı, Konstantinos Kanellopoulos, Juan Gómez-Luna, Antonio J. Peña, Mohammad Sadrosadati, Onur Mutlu | Published: 2026-05-13
効率評価
計算複雑性
透かし設計

SoK: Unlearnability and Unlearning for Model Dememorization

Authors: Mengying Zhang, Derui Wang, Ruoxi Sun, Xiaoyu Xia, Shuang Hao, Minhui Xue | Published: 2026-05-12
データ保護手法
モデルの頑健性保証
モデル保護手法

FlowSteer: Prompt-Only Workflow Steering Exposes Planning-Time Vulnerabilities in Multi-Agent LLM Systems

Authors: Fanxiao Li, Jiaying Wu, Tingchao Fu, Natasha Jaques, Wei Zhou, Min-Yen Kan | Published: 2026-05-12
インダイレクトプロンプトインジェクション
データ中心のセキュリティ
多エージェントシステムの評価

CTFusion: A CTF-based Benchmark for LLM Agent Evaluation

Authors: Dongjun Lee, Ga-eun Bae, Insu Yun | Published: 2026-05-12
CTF競技
信頼性評価
欺瞞検出

Can a Single Message Paralyze the AI Infrastructure? The Rise of AbO-DDoS Attacks through Targeted Mobius Injection

Authors: Zi Liang, Ronghua Li, Yanyun Wang, Qingqing Ye, Haibo Hu | Published: 2026-05-12
インダイレクトプロンプトインジェクション
ユーザー認証システム
攻撃の分類

Threat Modelling using Domain-Adapted Language Models: Empirical Evaluation and Insights

Authors: Saba Pourhanifeh, AbdulAziz AbdulGhaffar, Ashraf Matrawy | Published: 2026-05-11
プロンプトインジェクション
プロンプトリーキング
攻撃の分類