インダイレクトプロンプトインジェクション

Stop Testing Attacks, Start Diagnosing Defenses: The Four-Checkpoint Framework Reveals Where LLM Safety Breaks

Authors: Hayfa Dhabhi, Kashyap Thimmaraju | Published: 2026-02-10

プロンプトインジェクション

脆弱性分析

2026.02.10

文献データベース

When Handshakes Tell the Truth: Detecting Web Bad Bots via TLS Fingerprints

Authors: Ghalia Jarad, Kemal Bicakci | Published: 2026-02-10

TLSフィンガープリント

インダイレクトプロンプトインジェクション

ユーザー行動分析

2026.02.10

文献データベース

Clouding the Mirror: Stealthy Prompt Injection Attacks Targeting LLM-based Phishing Detection

Authors: Takashi Koide, Hiroki Nakano, Daiki Chiba | Published: 2026-02-05

インダイレクトプロンプトインジェクション

フィッシング検出手法

プロンプトインジェクション

2026.02.05

文献データベース

David vs. Goliath: Verifiable Agent-to-Agent Jailbreaking via Reinforcement Learning

Authors: Samuel Nellessen, Tal Kachman | Published: 2026-02-02

インダイレクトプロンプトインジェクション

マルチターン攻撃分析

強化学習攻撃

2026.02.02

文献データベース

GAVEL: Towards rule-based safety through activation monitoring

Authors: Shir Rozenfeld, Rahul Pankajakshan, Itay Zloczower, Eyal Lenga, Gilad Gressel, Yisroel Mirsky | Published: 2026-01-27

LLM性能評価

インダイレクトプロンプトインジェクション

データ生成手法

2026.01.27

文献データベース

An LLM Agent-based Framework for Whaling Countermeasures

Authors: Daisuke Miyamoto, Takuji Iimura, Narushige Michishita | Published: 2026-01-21

インダイレクトプロンプトインジェクション

メールセキュリティ

リスクシナリオ生成

2026.01.21

文献データベース

VirtualCrime: Evaluating Criminal Potential of Large Language Models via Sandbox Simulation

Authors: Yilin Tang, Yu Wang, Lanlan Qiu, Wenchang Gao, Yunfei Ma, Baicheng Chen, Tianxing He | Published: 2026-01-20

インダイレクトプロンプトインジェクション

リスク評価

犯罪シミュレーション

2026.01.20

文献データベース

PINA: Prompt Injection Attack against Navigation Agents

Authors: Jiani Liu, Yixin He, Lanlan Fan, Qidi Zhong, Yushi Cheng, Meng Zhang, Yanjiao Chen, Wenyuan Xu | Published: 2026-01-20

インダイレクトプロンプトインジェクション

性能評価

敵対的攻撃

2026.01.20

文献データベース

ReasAlign: Reasoning Enhanced Safety Alignment against Prompt Injection Attack

Authors: Hao Li, Yankai Yang, G. Edward Suh, Ning Zhang, Chaowei Xiao | Published: 2026-01-15

LLM活用

インダイレクトプロンプトインジェクション

プロンプトインジェクション

2026.01.15

文献データベース

The Promptware Kill Chain: How Prompt Injections Gradually Evolved Into a Multi-Step Malware

Authors: Ben Nassi, Bruce Schneier, Oleg Brodt | Published: 2026-01-14

LLM活用

インダイレクトプロンプトインジェクション

プロンプトインジェクション

2026.01.14

文献データベース