Decoupling Reconnaissance and Exploitation: Measuring the Capability Boundaries of LLM-Based Web Penetration Testing Authors: Liwei Yu, Shuo Li, Ming Zhou, Ge Chu, Yan Guo | Published: 2026-06-24 LLMの安全機構の解除エージェント設計自動化ペネトレーションテスト 2026.06.24 文献データベース
Now You (Still) See Me: Detecting Evasive Steganographic Payloads in LLMs Authors: Charles Westphal, Timothy Douglas, Keivan Navaie, Tiago Pimentel, Fernando E. Rosas | Published: 2026-06-08 LLMの安全機構の解除倫理基準遵守研究方法論 2026.06.08 文献データベース
Steganography Without Modification: Hidden Communication via LLM Seeds Authors: Felix Mächtle, Jonas Sander, Sebastian Berndt, Ben Weimar, Nils Loose, Thomas Eisenbarth | Published: 2026-06-08 LLMの安全機構の解除トークン識別手法確率分布 2026.06.08 文献データベース
Dissecting the Black Box: Circuit-Level Analysis of LLM Vulnerability Detection Authors: Syafiq Al Atiiq, Chun Zhou, Christian Gehrmann | Published: 2026-05-28 LLMの安全機構の解除モデルアーキテクチャ解釈手法 2026.05.28 文献データベース
SciIntBench: Measuring LLM Compliance with Research Integrity Norms Under Adversarial Framing Authors: Almene De Meran Meguimtsop, Maria Leonor Pacheco, Daniel E. Acuna | Published: 2026-05-28 LLMの安全機構の解除インダイレクトプロンプトインジェクション著者貢献 2026.05.28 文献データベース
Cordyceps: Covert Control Attacks on LLMs via Data Poisoning Authors: Zedian Shao, Charles Fleming, Teodora Baluta | Published: 2026-05-26 LLMの安全機構の解除ロバスト性評価透かしの耐久性 2026.05.26 文献データベース
Open-Weight LLM Fine-Tuning Defenses are Susceptible to Simple Attacks Authors: Kevin Kuo, Chhavi Yadav, Virginia Smith | Published: 2026-05-26 LLMの安全機構の解除ロバスト性評価防御手法の統合 2026.05.26 文献データベース
Model-Agnostic Lifelong LLM Safety via Externalized Attack-Defense Co-Evolution Authors: Xiaozhe Zhang, Chaozhuo Li, Hui Liu, Shaocheng Yan, Bingyu Yan, Qiwei Ye, Haoliang Li | Published: 2026-05-13 LLMの安全機構の解除アライメント行動解析手法 2026.05.13 文献データベース
Guaranteed Jailbreaking Defense via Disrupt-and-Rectify Smoothing Authors: Zheng Lin, Zhenxing Niu, Haoxuan Ji, Haichang Gao | Published: 2026-05-11 LLMの安全機構の解除プロンプトインジェクションモデルの堅牢性 2026.05.11 文献データベース
Usability as a Weapon: Attacking the Safety of LLM-Based Code Generation via Usability Requirements Authors: Yue Li, Xiao Li, Hao Wu, Yue Zhang, Yechao Zhang, Yating Liu, Fengyuan Xu, Sheng Zhong | Published: 2026-05-11 LLMの安全機構の解除セキュリティとユーザビリティのトレードオフ攻撃の評価 2026.05.11 文献データベース