インダイレクトプロンプトインジェクション

What Breaks Embodied AI Security:LLM Vulnerabilities, CPS Flaws,or Something Else?

Authors: Boyang Ma, Hechuan Guo, Peizhuo Lv, Minghui Xu, Xuelong Dai, YeChao Zhang, Yijun Yang, Yue Zhang | Published: 2026-02-19
インダイレクトプロンプトインジェクション
セキュリティ課題
プロンプトインジェクション

Mind the Gap: Evaluating LLMs for High-Level Malicious Package Detection vs. Fine-Grained Indicator Identification

Authors: Ahmed Ryan, Ibrahim Khalil, Abdullah Al Jahid, Md Erfan, Akond Ashfaque Ur Rahman, Md Rayhanur Rahman | Published: 2026-02-18
LLM性能評価
インダイレクトプロンプトインジェクション
プロンプトインジェクション

CAPID: Context-Aware PII Detection for Question-Answering Systems

Authors: Mariia Ponomarenko, Sepideh Abedini, Masoumeh Shafieinejad, D. B. Emerson, Shubhankar Mohapatra, Xi He | Published: 2026-02-10
インダイレクトプロンプトインジェクション
データ流出に関する分析手法
プライバシー保証

Stop Testing Attacks, Start Diagnosing Defenses: The Four-Checkpoint Framework Reveals Where LLM Safety Breaks

Authors: Hayfa Dhabhi, Kashyap Thimmaraju | Published: 2026-02-10
インダイレクトプロンプトインジェクション
プロンプトインジェクション
脆弱性分析

When Handshakes Tell the Truth: Detecting Web Bad Bots via TLS Fingerprints

Authors: Ghalia Jarad, Kemal Bicakci | Published: 2026-02-10
TLSフィンガープリント
インダイレクトプロンプトインジェクション
ユーザー行動分析

Clouding the Mirror: Stealthy Prompt Injection Attacks Targeting LLM-based Phishing Detection

Authors: Takashi Koide, Hiroki Nakano, Daiki Chiba | Published: 2026-02-05
インダイレクトプロンプトインジェクション
フィッシング検出手法
プロンプトインジェクション

David vs. Goliath: Verifiable Agent-to-Agent Jailbreaking via Reinforcement Learning

Authors: Samuel Nellessen, Tal Kachman | Published: 2026-02-02
インダイレクトプロンプトインジェクション
マルチターン攻撃分析
強化学習攻撃

GAVEL: Towards rule-based safety through activation monitoring

Authors: Shir Rozenfeld, Rahul Pankajakshan, Itay Zloczower, Eyal Lenga, Gilad Gressel, Yisroel Mirsky | Published: 2026-01-27
LLM性能評価
インダイレクトプロンプトインジェクション
データ生成手法

An LLM Agent-based Framework for Whaling Countermeasures

Authors: Daisuke Miyamoto, Takuji Iimura, Narushige Michishita | Published: 2026-01-21
インダイレクトプロンプトインジェクション
メールセキュリティ
リスクシナリオ生成

VirtualCrime: Evaluating Criminal Potential of Large Language Models via Sandbox Simulation

Authors: Yilin Tang, Yu Wang, Lanlan Qiu, Wenchang Gao, Yunfei Ma, Baicheng Chen, Tianxing He | Published: 2026-01-20
インダイレクトプロンプトインジェクション
リスク評価
犯罪シミュレーション