Prompt validation

PromptLocate: Localizing Prompt Injection Attacks

Authors: Yuqi Jia, Yupei Liu, Zedian Shao, Jinyuan Jia, Neil Gong | Published: 2025-10-14

Prompt validation

Large Language Model

evaluation metrics

2025.10.14 2025.10.16

Literature Database

P2P: A Poison-to-Poison Remedy for Reliable Backdoor Defense in LLMs

Authors: Shuai Zhao, Xinyi Wu, Shiqian Zhao, Xiaobao Wu, Zhongliang Guo, Yanhao Jia, Anh Tuan Luu | Published: 2025-10-06

Prompt Injection

Prompt validation

防御手法の統合

2025.10.06 2025.10.08

Literature Database

Detection of security smells in IaC scripts through semantics-aware code and language processing

Authors: Aicha War, Adnan A. Rawass, Abdoul K. Kabore, Jordan Samhi, Jacques Klein, Tegawende F. Bissyande | Published: 2025-09-23

コード表現技術

Security Analysis

Prompt validation

2025.09.23 2025.09.25

Literature Database

EPT Benchmark: Evaluation of Persian Trustworthiness in Large Language Models

Authors: Mohammad Reza Mirbagheri, Mohammad Mahdi Mirkamali, Zahra Motoshaker Arani, Ali Javeri, Amir Mahdi Sadeghzadeh, Rasool Jalili | Published: 2025-09-08

Fairness Learning

Prompt validation

安全性

2025.09.08 2025.09.10

Literature Database

PromptCOS: Towards System Prompt Copyright Auditing for LLMs via Content-level Output Similarity

Authors: Yuchen Yang, Yiming Li, Hongwei Yao, Enhao Huang, Shuo Shao, Bingrun Yang, Zhibo Wang, Dacheng Tao, Zhan Qin | Published: 2025-09-03

Prompt validation

Prompt leaking

Model Extraction Attack

2025.09.03 2025.09.05

Literature Database

EverTracer: Hunting Stolen Large Language Models via Stealthy and Robust Probabilistic Fingerprint

Authors: Zhenhua Xu, Meng Han, Wenpeng Xing | Published: 2025-09-03

Disabling Safety Mechanisms of LLM

Data Protection Method

Prompt validation

2025.09.03 2025.09.05

Literature Database

PromptSleuth: Detecting Prompt Injection via Semantic Intent Invariance

Authors: Mengxiao Wang, Yuxuan Zhang, Guofei Gu | Published: 2025-08-28

Indirect Prompt Injection

Prompt Injection

Prompt validation

2025.08.28 2025.09.01

Literature Database

Attacking interpretable NLP systems

Authors: Eldor Abdukhamidov, Tamer Abuhmed, Joanna C. S. Santos, Mohammed Abuhamad | Published: 2025-07-22

Prompt Injection

Prompt validation

Adversarial Attack Methods

2025.07.22 2025.07.24

Literature Database

AICrypto: A Comprehensive Benchmark for Evaluating Cryptography Capabilities of Large Language Models

Authors: Yu Wang, Yijian Liu, Liheng Ji, Han Luo, Wenjie Li, Xiaofei Zhou, Chiyun Feng, Puji Wang, Yuhan Cao, Geyuan Zhang, Xiaojian Li, Rongwu Xu, Yilei Chen, Tianxing He | Published: 2025-07-13 | Updated: 2025-09-30

Algorithm

Hallucination

Prompt validation

2025.07.13 2025.10.02

Literature Database

GuardVal: Dynamic Large Language Model Jailbreak Evaluation for Comprehensive Safety Testing

Authors: Peiyan Zhang, Haibo Jin, Liying Kang, Haohan Wang | Published: 2025-07-10

Prompt validation

Large Language Model

Performance Evaluation Metrics

2025.07.10 2025.07.12

Literature Database