プロンプトインジェクション

Beyond Surface Alignment: Rebuilding LLMs Safety Mechanism via Probabilistically Ablating Refusal Direction

Authors: Yuanbo Xie, Yingjie Zhang, Tianyun Liu, Duohe Ma, Tingwen Liu | Published: 2025-09-18

プロンプトインジェクション

安全性アライメント

拒否メカニズム

2025.09.18

文献データベース

A Multi-Agent LLM Defense Pipeline Against Prompt Injection Attacks

Authors: S M Asif Hossain, Ruksat Khan Shayoni, Mohd Ruhul Ameen, Akif Islam, M. F. Mridha, Jungpil Shin | Published: 2025-09-16 | Updated: 2025-10-01

インダイレクトプロンプトインジェクション

プロンプトインジェクション

分散型LLMアーキテクチャ

2025.09.16

文献データベース

Jailbreaking Large Language Models Through Content Concretization

Authors: Johan Wahréus, Ahmed Hussain, Panos Papadimitratos | Published: 2025-09-16

プロンプトインジェクション

モデル評価

評価指標

2025.09.16

文献データベース

NeuroStrike: Neuron-Level Attacks on Aligned LLMs

Authors: Lichao Wu, Sasha Behrouzi, Mohamadreza Rostami, Maximilian Thang, Stjepan Picek, Ahmad-Reza Sadeghi | Published: 2025-09-15

プロンプトインジェクション

大規模言語モデル

安全性メカニズムの分析

2025.09.15

文献データベース

SoK: How Sensor Attacks Disrupt Autonomous Vehicles: An End-to-end Analysis, Challenges, and Missed Threats

Authors: Qingzhao Zhang, Shaocheng Luo, Z. Morley Mao, Miroslav Pajic, Michael K. Reiter | Published: 2025-09-14 | Updated: 2025-09-16

システムエラープロパゲーション

プロンプトインジェクション

攻撃タイプ

2025.09.14

文献データベース

AgriSentinel: Privacy-Enhanced Embedded-LLM Crop Disease Alerting System

Authors: Chanti Raju Mylay, Bobin Deng, Zhipeng Cai, Honghui Xu | Published: 2025-09-11

プロンプトインジェクション

作物病害管理

農薬使用法

2025.09.11

文献データベース

An Ethically Grounded LLM-Based Approach to Insider Threat Synthesis and Detection

Authors: Haywood Gelman, John D. Hastings, David Kenley | Published: 2025-09-08

プロンプトインジェクション

不均衡データセット

合成データ生成

2025.09.08

文献データベース

Mask-GCG: Are All Tokens in Adversarial Suffixes Necessary for Jailbreak Attacks?

Authors: Junjie Mu, Zonghao Ying, Zhekui Fan, Zonglei Jing, Yaoyuan Zhang, Zhengmin Yu, Wenxin Zhang, Quanchen Zou, Xiangzheng Zhang | Published: 2025-09-08

トークンの処理と収集

プルーニング手法

プロンプトインジェクション

2025.09.08

文献データベース

Exploit Tool Invocation Prompt for Tool Behavior Hijacking in LLM-Based Agentic System

Authors: Yu Liu, Yuchong Xie, Mingyu Luo, Zesen Liu, Zhixiang Zhang, Kaikai Zhang, Zongjie Li, Ping Chen, Shuai Wang, Dongdong She | Published: 2025-09-06 | Updated: 2025-09-15

プロンプトインジェクション

モデルDoS

攻撃の評価

2025.09.06

文献データベース

Self-adaptive Dataset Construction for Real-World Multimodal Safety Scenarios

Authors: Jingen Qu, Lijun Li, Bo Zhang, Yichen Yan, Jing Shao | Published: 2025-09-04

プロンプトインジェクション

リスク分析手法

安全性評価手法

2025.09.04

文献データベース