神経細胞と安全性

NeuroBreak: Unveil Internal Jailbreak Mechanisms in Large Language Models

Authors: Chuhan Zhang, Ye Zhang, Bowen Shi, Yuyou Gan, Tianyu Du, Shouling Ji, Dazhan Deng, Yingcai Wu | Published: 2025-09-04

Prompt Injection

神経細胞と安全性

Defense Mechanism

2025.09.04 2025.09.06

Literature Database