LLM Performance Evaluation

Watermarking Needs Input Repetition Masking

Authors: David Khachaturov, Robert Mullins, Ilia Shumailov, Sumanth Dathathri | Published: 2025-04-16

Prompt validation

Watermark Design

2025.04.16 2025.05.27

Literature Database

The Digital Cybersecurity Expert: How Far Have We Come?

Authors: Dawei Wang, Geng Zhou, Xianglong Li, Yu Bai, Li Chen, Ting Qin, Jian Sun, Dan Li | Published: 2025-04-16

LLM Performance Evaluation

Poisoning attack on RAG

Prompt Injection

2025.04.16 2025.05.27

Literature Database

Progent: Programmable Privilege Control for LLM Agents

Authors: Tianneng Shi, Jingxuan He, Zhun Wang, Linyu Wu, Hongwei Li, Wenbo Guo, Dawn Song | Published: 2025-04-16

LLM Performance Evaluation

Indirect Prompt Injection

Privacy Protection Mechanism

2025.04.16 2025.05.27

Literature Database

Exploring Backdoor Attack and Defense for LLM-empowered Recommendations

Authors: Liangbo Ning, Wenqi Fan, Qing Li | Published: 2025-04-15

LLM Performance Evaluation

Poisoning attack on RAG

Adversarial Attack Analysis

2025.04.15 2025.05.27

Literature Database

Bypassing Prompt Injection and Jailbreak Detection in LLM Guardrails

Authors: William Hackett, Lewis Birch, Stefan Trawicki, Neeraj Suri, Peter Garraghan | Published: 2025-04-15 | Updated: 2025-04-16

LLM Performance Evaluation

Prompt Injection

Adversarial Attack Analysis

2025.04.15 2025.05.27

Literature Database

StruPhantom: Evolutionary Injection Attacks on Black-Box Tabular Agents Powered by Large Language Models

Authors: Yang Feng, Xudong Pan | Published: 2025-04-14

LLM Performance Evaluation

Indirect Prompt Injection

Malicious Website Detection

2025.04.14 2025.05.27

Literature Database

An Investigation of Large Language Models and Their Vulnerabilities in Spam Detection

Authors: Qiyao Tang, Xiangyang Li | Published: 2025-04-14

LLM Performance Evaluation

Prompt Injection

Model DoS

2025.04.14 2025.05.27

Literature Database

PR-Attack: Coordinated Prompt-RAG Attacks on Retrieval-Augmented Generation in Large Language Models via Bilevel Optimization

Authors: Yang Jiao, Xiaodong Wang, Kai Yang | Published: 2025-04-10 | Updated: 2025-04-17

LLM Performance Evaluation

Poisoning attack on RAG

Adversarial Attack Assessment

2025.04.10 2025.05.27

Literature Database

TrafficLLM: Enhancing Large Language Models for Network Traffic Analysis with Generic Traffic Representation

Authors: Tianyu Cui, Xinjie Lin, Sijia Li, Miao Chen, Qilei Yin, Qi Li, Ke Xu | Published: 2025-04-05 | Updated: 2025-04-15

LLM Performance Evaluation

Task-Specific Tuning

Model Robustness

2025.04.05 2025.05.27

Literature Database

On Benchmarking Code LLMs for Android Malware Analysis

Authors: Yiling He, Hongyu She, Xingzhi Qian, Xinran Zheng, Zhuo Chen, Zhan Qin, Lorenzo Cavallaro | Published: 2025-04-01 | Updated: 2025-04-23

LLM Performance Evaluation

Malware Detection Method

Research Methodology

2025.04.01 2025.05.27

Literature Database