インダイレクトプロンプトインジェクション

Monitoring LLM-based Multi-Agent Systems Against Corruptions via Node Evaluation

Authors: Chengcan Wu, Zhixin Zhang, Mingqian Xu, Zeming Wei, Meng Sun | Published: 2025-10-22
インダイレクトプロンプトインジェクション
エージェント設計
ネットワーク脅威検出

Defending Against Prompt Injection with DataFilter

Authors: Yizhu Wang, Sizhe Chen, Raghad Alkhudair, Basel Alomair, David Wagner | Published: 2025-10-22
インダイレクトプロンプトインジェクション
プロンプトインジェクション
プロンプトインジェクション攻撃

LLM Agents for Automated Web Vulnerability Reproduction: Are We There Yet?

Authors: Bin Liu, Yanjie Zhao, Guoai Xu, Haoyu Wang | Published: 2025-10-16
インダイレクトプロンプトインジェクション
エージェント設計
セキュリティ分析

In-Browser LLM-Guided Fuzzing for Real-Time Prompt Injection Testing in Agentic AI Browsers

Authors: Avihay Cohen | Published: 2025-10-15
インダイレクトプロンプトインジェクション
大規模言語モデル
自動生成フレームワーク

TypePilot: Leveraging the Scala Type System for Secure LLM-generated Code

Authors: Alexander Sternfeld, Andrei Kucharavy, Ljiljana Dolamic | Published: 2025-10-13
インダイレクトプロンプトインジェクション
セキュリティ分析手法
プロンプトリーキング

From Defender to Devil? Unintended Risk Interactions Induced by LLM Defenses

Authors: Xiangtao Meng, Tianshuo Cong, Li Wang, Wenyu Chen, Zheng Li, Shanqing Guo, Xiaoyun Wang | Published: 2025-10-09
アライメント
インダイレクトプロンプトインジェクション
防御効果分析

Unified Threat Detection and Mitigation Framework (UTDMF): Combating Prompt Injection, Deception, and Bias in Enterprise-Scale Transformers

Authors: Santhosh KumarRavindran | Published: 2025-10-06
インダイレクトプロンプトインジェクション
バイアス緩和手法
防御手法の統合

Autonomy Matters: A Study on Personalization-Privacy Dilemma in LLM Agents

Authors: Zhiping Zhang, Yi Evie Zhang, Freda Shi, Tianshi Li | Published: 2025-10-06
インダイレクトプロンプトインジェクション
プライバシー保護機械学習
ユーザー活動解析

Position: Privacy Is Not Just Memorization!

Authors: Niloofar Mireshghallah, Tianshi Li | Published: 2025-10-02
インダイレクトプロンプトインジェクション
プライバシー保護機械学習
プライバシー分類

Fine-Tuning Jailbreaks under Highly Constrained Black-Box Settings: A Three-Pronged Approach

Authors: Xiangfang Li, Yu Wang, Bo Li | Published: 2025-10-01 | Updated: 2025-10-09
インダイレクトプロンプトインジェクション
プロンプトリーキング
防御メカニズム