Literature Database

What Really Matters in Many-Shot Attacks? An Empirical Study of Long-Context Vulnerabilities in LLMs

Authors: Sangyeop Kim, Yohan Lee, Yongwoo Song, Kimin Lee | Published: 2025-05-26

Prompt Injection

Model Performance Evaluation

Large Language Model

2025.05.26 2025.05.28

Literature Database

CoTGuard: Using Chain-of-Thought Triggering for Copyright Protection in Multi-Agent LLM Systems

Authors: Yan Wen, Junfeng Guo, Heng Huang | Published: 2025-05-26

LLM Security

トリガーベースの透かし

著作権保護

2025.05.26 2025.05.28

Literature Database

VADER: A Human-Evaluated Benchmark for Vulnerability Assessment, Detection, Explanation, and Remediation

Authors: Ethan TS. Liu, Austin Wang, Spencer Mateega, Carlos Georgescu, Danny Tang | Published: 2025-05-26

Website Vulnerability

Hallucination

Dynamic Vulnerability Management

2025.05.26 2025.05.28

Literature Database

Security Concerns for Large Language Models: A Survey

Authors: Miles Q. Li, Benjamin C. M. Fung | Published: 2025-05-24 | Updated: 2025-08-20

Indirect Prompt Injection

Prompt Injection

Psychological Manipulation

2025.05.24 2025.08.22

Literature Database

LLM-Driven APT Detection for 6G Wireless Networks: A Systematic Review and Taxonomy

Authors: Muhammed Golec, Yaser Khamayseh, Suhib Bani Melhem, Abdulmalik Alwarafy | Published: 2025-05-24 | Updated: 2025-06-23

LLMとAPTの関係

Information Security

Research Methodology

2025.05.24 2025.06.25

Literature Database

Invisible Prompts, Visible Threats: Malicious Font Injection in External Resources for Large Language Models

Authors: Junjie Xiong, Changjia Zhu, Shuhang Lin, Chong Zhang, Yongfeng Zhang, Yao Liu, Lingyao Li | Published: 2025-05-22

LLM Security

Disabling Safety Mechanisms of LLM

Prompt Injection

2025.05.22 2025.05.28

Literature Database

Backdoor Cleaning without External Guidance in MLLM Fine-tuning

Authors: Xuankun Rong, Wenke Huang, Jian Liang, Jinhe Bi, Xun Xiao, Yiming Li, Bo Du, Mang Ye | Published: 2025-05-22

LLM Security

Backdoor Attack

2025.05.22 2025.05.28

Literature Database

CAIN: Hijacking LLM-Humans Conversations via a Two-Stage Malicious System Prompt Generation and Refining Framework

Authors: Viet Pham, Thai Le | Published: 2025-05-22

LLM Security

Prompt Injection

Adversarial Learning

2025.05.22 2025.05.28

Literature Database

Unlearning Isn’t Deletion: Investigating Reversibility of Machine Unlearning in LLMs

Authors: Xiaoyu Xu, Xiang Yue, Yang Liu, Qingqing Ye, Haibo Hu, Minxin Du | Published: 2025-05-22

Bias Detection in AI Output

Privacy Management

Machine learning

2025.05.22 2025.05.28

Literature Database

CoTSRF: Utilize Chain of Thought as Stealthy and Robust Fingerprint of Large Language Models

Authors: Zhenzhen Ren, GuoBiao Li, Sheng Li, Zhenxing Qian, Xinpeng Zhang | Published: 2025-05-22

LLM Security

Fingerprinting Method

Model Identification

2025.05.22 2025.05.28

Literature Database