文献データベース

KVerus: Scalable and Resilient Formal Verification Proof Generation for Rust Code

Authors: Yuwei Liu, Xinyi Wan, Yanhao Wang, Minghua Wang, Lin Huang, Tao Wei | Published: 2026-05-05
データ整合性制約
堅牢性検証手法
証明生成手法

GPUBreach: Privilege Escalation Attacks on GPUs using Rowhammer

Authors: Chris S. Lin, Yuqin Yan, Guozhen Ding, Joyce Qu, Joseph Zhu, David Lie, Gururaj Saileshwar | Published: 2026-05-05
GPUメモリ管理
メモリ効率化手法
攻撃タイプ

Bandits attack function optimization

Authors: Philippe Preux, Rémi Munos, Michal Valko | Published: 2026-05-05
探索と活用のジレンマ
最適化アルゴリズム
機械学習手法

Exposing LLM Safety Gaps Through Mathematical Encoding:New Attacks and Systematic Analysis

Authors: Haoyu Zhang, Mohammad Zandsalimy, Shanu Sushmita | Published: 2026-05-05
LLMの安全機構の解除
プロンプトインジェクション
研究方法論

ARGUS: Defending LLM Agents Against Context-Aware Prompt Injection

Authors: Shihao Weng, Yang Feng, Jinrui Zhang, Xiaofei Xie, Jiongchi Yu, Jia Liu | Published: 2026-05-05
RAG
インダイレクトプロンプトインジェクション
評価手法

Efficient Preference Poisoning Attack on Offline RLHF

Authors: Chenye Yang, Weiyu Xu, Lifeng Lai | Published: 2026-05-04
アライメント
ポイズニング
ポイズニング攻撃

FlashRT: Towards Computationally and Memory Efficient Red-Teaming for Prompt Injection and Knowledge Corruption

Authors: Yanting Wang, Chenlong Yin, Ying Chen, Jinyuan Jia | Published: 2026-04-30
LLM性能評価
RAGへのポイズニング攻撃
プロンプトリーキング

TwinGate: Stateful Defense against Decompositional Jailbreaks in Untraceable Traffic via Asymmetric Contrastive Learning

Authors: Bowen Sun, Chaozhuo Li, Yaodong Yang, Yiwei Wang, Chaowei Xiao | Published: 2026-04-30
プロンプトインジェクション
研究方法論
評価手法

MASCing: Configurable Mixture-of-Experts Behavior via Activation Steering Masks

Authors: Jona te Lintelo, Lichao Wu, Marina Krček, Sengim Karayalçin, Stjepan Picek | Published: 2026-04-30
インダイレクトプロンプトインジェクション
一般化性能
大規模言語モデル

VOW: Verifiable and Oblivious Watermark Detection for Large Language Models

Authors: Xiaokun Luan, Yihao Zhang, Pengcheng Su, Feiran Lei, Meng Sun | Published: 2026-04-30
生成AI向け電子透かし
評価手法
透かし技術