プロンプトインジェクション

SoK: a Comprehensive Causality Analysis Framework for Large Language Model Security

Authors: Wei Zhao, Zhe Li, Jun Sun | Published: 2025-12-04
プロンプトインジェクション
因果推論
大規模言語モデル

In-Context Representation Hijacking

Authors: Itay Yona, Amir Sarid, Michael Karasik, Yossi Gandelsman | Published: 2025-12-03
サイバーセキュリティ
プロンプトインジェクション
プロンプトリーキング

HarnessAgent: Scaling Automatic Fuzzing Harness Construction with Tool-Augmented LLM Pipelines

Authors: Kang Yang, Yunhang Zhang, Zichuan Li, GuanHong Tao, Jun Xu, XiaoJing Liao | Published: 2025-12-03
プロンプトインジェクション
モデルDoS
自動化ペネトレーションテスト

Immunity memory-based jailbreak detection: multi-agent adaptive guard for large language models

Authors: Jun Leng, Litian Zhang, Xi Zhang | Published: 2025-12-03
プロンプトインジェクション
メモリ化メカニズム
攻撃検出手法

Contextual Image Attack: How Visual Context Exposes Multimodal Safety Vulnerabilities

Authors: Yuan Xiong, Ziqi Miao, Lijun Li, Chen Qian, Jie Li, Jing Shao | Published: 2025-12-02
プロンプトインジェクション
モデルDoS
画像生成技術

CryptoQA: A Large-scale Question-answering Dataset for AI-assisted Cryptography

Authors: Mayar Elfares, Pascal Reisert, Tilman Dietz, Manpa Barman, Ahmed Zaki, Ralf Küsters, Andreas Bulling | Published: 2025-12-02
データセット生成
プロンプトインジェクション
プロンプトリーキング

Leveraging Large Language Models to Bridge On-chain and Off-chain Transparency in Stablecoins

Authors: Yuexin Xiang, Yuchen Lei, SM Mahir Shazeed Rish, Yuanzhe Zhang, Qin Wang, Tsz Hon Yuen, Jiangshan Yu | Published: 2025-12-02
ブロックチェーン統合
プロンプトインジェクション
リスク分析手法

A Wolf in Sheep’s Clothing: Bypassing Commercial LLM Guardrails via Harmless Prompt Weaving and Adaptive Tree Search

Authors: Rongzhe Wei, Peizhi Niu, Xinjie Shen, Tony Tu, Yifan Li, Ruihan Wu, Eli Chien, Olgica Milenkovic, Pan Li | Published: 2025-12-01
トレーニング手法
プロンプトインジェクション
倫理的考慮

DefenSee: Dissecting Threat from Sight and Text – A Multi-View Defensive Pipeline for Multi-modal Jailbreaks

Authors: Zihao Wang, Kar Wai Fok, Vrizlynn L. L. Thing | Published: 2025-12-01
プロンプトインジェクション
モデルDoS
堅牢性向上手法

Constructing and Benchmarking: a Labeled Email Dataset for Text-Based Phishing and Spam Detection Framework

Authors: Rebeka Toth, Tamas Bisztray, Richard Dubniczky | Published: 2025-11-26
ソーシャルエンジニアリング攻撃
データセット統合
プロンプトインジェクション