インダイレクトプロンプトインジェクション

What Breaks Embodied AI Security:LLM Vulnerabilities, CPS Flaws,or Something Else?

Authors: Boyang Ma, Hechuan Guo, Peizhuo Lv, Minghui Xu, Xuelong Dai, YeChao Zhang, Yijun Yang, Yue Zhang | Published: 2026-02-19

セキュリティ課題

プロンプトインジェクション

2026.02.19

文献データベース

Mind the Gap: Evaluating LLMs for High-Level Malicious Package Detection vs. Fine-Grained Indicator Identification

Authors: Ahmed Ryan, Ibrahim Khalil, Abdullah Al Jahid, Md Erfan, Akond Ashfaque Ur Rahman, Md Rayhanur Rahman | Published: 2026-02-18

LLM性能評価

インダイレクトプロンプトインジェクション

プロンプトインジェクション

2026.02.18

文献データベース

CAPID: Context-Aware PII Detection for Question-Answering Systems

Authors: Mariia Ponomarenko, Sepideh Abedini, Masoumeh Shafieinejad, D. B. Emerson, Shubhankar Mohapatra, Xi He | Published: 2026-02-10

インダイレクトプロンプトインジェクション

データ流出に関する分析手法

プライバシー保証

2026.02.10

文献データベース

Stop Testing Attacks, Start Diagnosing Defenses: The Four-Checkpoint Framework Reveals Where LLM Safety Breaks

Authors: Hayfa Dhabhi, Kashyap Thimmaraju | Published: 2026-02-10

インダイレクトプロンプトインジェクション

プロンプトインジェクション

脆弱性分析

2026.02.10

文献データベース

When Handshakes Tell the Truth: Detecting Web Bad Bots via TLS Fingerprints

Authors: Ghalia Jarad, Kemal Bicakci | Published: 2026-02-10

TLSフィンガープリント

インダイレクトプロンプトインジェクション

ユーザー行動分析

2026.02.10

文献データベース

Clouding the Mirror: Stealthy Prompt Injection Attacks Targeting LLM-based Phishing Detection

Authors: Takashi Koide, Hiroki Nakano, Daiki Chiba | Published: 2026-02-05

インダイレクトプロンプトインジェクション

フィッシング検出手法

プロンプトインジェクション

2026.02.05

文献データベース

David vs. Goliath: Verifiable Agent-to-Agent Jailbreaking via Reinforcement Learning

Authors: Samuel Nellessen, Tal Kachman | Published: 2026-02-02

インダイレクトプロンプトインジェクション

マルチターン攻撃分析

強化学習攻撃

2026.02.02

文献データベース

GAVEL: Towards rule-based safety through activation monitoring

Authors: Shir Rozenfeld, Rahul Pankajakshan, Itay Zloczower, Eyal Lenga, Gilad Gressel, Yisroel Mirsky | Published: 2026-01-27

LLM性能評価

インダイレクトプロンプトインジェクション

データ生成手法

2026.01.27

文献データベース

An LLM Agent-based Framework for Whaling Countermeasures

Authors: Daisuke Miyamoto, Takuji Iimura, Narushige Michishita | Published: 2026-01-21

インダイレクトプロンプトインジェクション

メールセキュリティ

リスクシナリオ生成

2026.01.21

文献データベース

VirtualCrime: Evaluating Criminal Potential of Large Language Models via Sandbox Simulation

Authors: Yilin Tang, Yu Wang, Lanlan Qiu, Wenchang Gao, Yunfei Ma, Baicheng Chen, Tianxing He | Published: 2026-01-20

インダイレクトプロンプトインジェクション

リスク評価

犯罪シミュレーション

2026.01.20

文献データベース