Leveraging Large Language Models to Bridge On-chain and Off-chain Transparency in Stablecoins Authors: Yuexin Xiang, Yuchen Lei, SM Mahir Shazeed Rish, Yuanzhe Zhang, Qin Wang, Tsz Hon Yuen, Jiangshan Yu | Published: 2025-12-02 ブロックチェーン統合プロンプトインジェクションリスク分析手法 2025.12.02 文献データベース
A Wolf in Sheep’s Clothing: Bypassing Commercial LLM Guardrails via Harmless Prompt Weaving and Adaptive Tree Search Authors: Rongzhe Wei, Peizhi Niu, Xinjie Shen, Tony Tu, Yifan Li, Ruihan Wu, Eli Chien, Olgica Milenkovic, Pan Li | Published: 2025-12-01 トレーニング手法プロンプトインジェクション倫理的考慮 2025.12.01 文献データベース
DefenSee: Dissecting Threat from Sight and Text – A Multi-View Defensive Pipeline for Multi-modal Jailbreaks Authors: Zihao Wang, Kar Wai Fok, Vrizlynn L. L. Thing | Published: 2025-12-01 プロンプトインジェクションモデルDoS堅牢性向上手法 2025.12.01 文献データベース
Constructing and Benchmarking: a Labeled Email Dataset for Text-Based Phishing and Spam Detection Framework Authors: Rebeka Toth, Tamas Bisztray, Richard Dubniczky | Published: 2025-11-26 ソーシャルエンジニアリング攻撃データセット統合プロンプトインジェクション 2025.11.26 文献データベース
GuardTrace-VL: Detecting Unsafe Multimodel Reasoning via Iterative Safety Supervision Authors: Yuxiao Xiang, Junchi Chen, Zhenchao Jin, Changtao Miao, Haojie Yuan, Qi Chu, Tao Gong, Nenghai Yu | Published: 2025-11-26 プロンプトインジェクションリスク評価手法倫理的考慮 2025.11.26 文献データベース
Can LLMs Make (Personalized) Access Control Decisions? Authors: Friederike Groschupp, Daniele Lain, Aritra Dhar, Lara Magdalena Lazier, Srdjan Čapkun | Published: 2025-11-25 LLMの安全機構の解除プライバシー評価プロンプトインジェクション 2025.11.25 文献データベース
Adversarial Attack-Defense Co-Evolution for LLM Safety Alignment via Tree-Group Dual-Aware Search and Optimization Authors: Xurui Li, Kaisong Song, Rui Zhu, Pin-Yu Chen, Haixu Tang | Published: 2025-11-24 プロンプトインジェクション大規模言語モデル悪意のあるプロンプト 2025.11.24 文献データベース
Can LLMs Threaten Human Survival? Benchmarking Potential Existential Threats from LLMs via Prefix Completion Authors: Yu Cui, Yifei Liu, Hang Fu, Sicheng Pan, Haibin Zhang, Cong Zuo, Licheng Wang | Published: 2025-11-24 インダイレクトプロンプトインジェクションプロンプトインジェクションリスク評価手法 2025.11.24 文献データベース
Understanding and Mitigating Over-refusal for Large Language Models via Safety Representation Authors: Junbo Zhang, Ran Chen, Qianli Zhou, Xinyang Deng, Wen Jiang | Published: 2025-11-24 LLMの安全機構の解除プロンプトインジェクション悪意のあるプロンプト 2025.11.24 文献データベース
Small Language Models for Phishing Website Detection: Cost, Performance, and Privacy Trade-Offs Authors: Georg Goldenits, Philip Koenig, Sebastian Raubitzek, Andreas Ekelhart | Published: 2025-11-19 フィッシング検出手法プロンプトインジェクションプロンプトエンジニアリング 2025.11.19 文献データベース