Literature Database

GPUBreach: Privilege Escalation Attacks on GPUs using Rowhammer

Authors: Chris S. Lin, Yuqin Yan, Guozhen Ding, Joyce Qu, Joseph Zhu, David Lie, Gururaj Saileshwar | Published: 2026-05-05

GPUメモリ管理

メモリ効率化手法

Attack Type

2026.05.05 2026.05.07

Literature Database

Bandits attack function optimization

Authors: Philippe Preux, Rémi Munos, Michal Valko | Published: 2026-05-05

探索と活用のジレンマ

最適化アルゴリズム

Machine Learning Method

2026.05.05 2026.05.07

Literature Database

Exposing LLM Safety Gaps Through Mathematical Encoding:New Attacks and Systematic Analysis

Authors: Haoyu Zhang, Mohammad Zandsalimy, Shanu Sushmita | Published: 2026-05-05

Disabling Safety Mechanisms of LLM

Prompt Injection

Research Methodology

2026.05.05 2026.05.07

Literature Database

ARGUS: Defending LLM Agents Against Context-Aware Prompt Injection

Authors: Shihao Weng, Yang Feng, Jinrui Zhang, Xiaofei Xie, Jiongchi Yu, Jia Liu | Published: 2026-05-05

RAG

Indirect Prompt Injection

Evaluation Method

2026.05.05 2026.05.07

Literature Database

Efficient Preference Poisoning Attack on Offline RLHF

Authors: Chenye Yang, Weiyu Xu, Lifeng Lai | Published: 2026-05-04

Alignment

Poisoning

Poisoning Attack

2026.05.04 2026.05.06

Literature Database

FlashRT: Towards Computationally and Memory Efficient Red-Teaming for Prompt Injection and Knowledge Corruption

Authors: Yanting Wang, Chenlong Yin, Ying Chen, Jinyuan Jia | Published: 2026-04-30

LLM Performance Evaluation

Poisoning attack on RAG

Prompt leaking

2026.04.30 2026.05.02

Literature Database

TwinGate: Stateful Defense against Decompositional Jailbreaks in Untraceable Traffic via Asymmetric Contrastive Learning

Authors: Bowen Sun, Chaozhuo Li, Yaodong Yang, Yiwei Wang, Chaowei Xiao | Published: 2026-04-30

Prompt Injection

Research Methodology

Evaluation Method

2026.04.30 2026.05.02

Literature Database

MASCing: Configurable Mixture-of-Experts Behavior via Activation Steering Masks

Authors: Jona te Lintelo, Lichao Wu, Marina Krček, Sengim Karayalçin, Stjepan Picek | Published: 2026-04-30

Indirect Prompt Injection

Generalization Performance

Large Language Model

2026.04.30 2026.05.02

Literature Database

VOW: Verifiable and Oblivious Watermark Detection for Large Language Models

Authors: Xiaokun Luan, Yihao Zhang, Pengcheng Su, Feiran Lei, Meng Sun | Published: 2026-04-30

Digital Watermarking for Generative AI

Evaluation Method

Watermarking Technology

2026.04.30 2026.05.02

Literature Database

Low Rank Adaptation for Adversarial Perturbation

Authors: Han Liu, Shanghao Shi, Yevgeniy Vorobeychik, Chongjie Zhang, Ning Zhang | Published: 2026-04-30

Generalization Performance

低ランク敵対的攻撃

Adversarial Learning

2026.04.30 2026.05.02

Literature Database