プロンプトインジェクション

Safeguard-by-Development: A Privacy-Enhanced Development Paradigm for Multi-Agent Collaboration Systems

Authors: Jian Cui, Zichuan Li, Luyi Xing, Xiaojing Liao | Published: 2025-05-07 | Updated: 2025-06-24

プライバシー保護

プライバシー保護フレームワーク

プロンプトインジェクション

2025.05.07

文献データベース

LlamaFirewall: An open source guardrail system for building secure AI agents

Authors: Sahana Chennabasappa, Cyrus Nikolaidis, Daniel Song, David Molnar, Stephanie Ding, Shengye Wan, Spencer Whitman, Lauren Deason, Nicholas Doucette, Abraham Montilla, Alekhya Gampa, Beto de Paola, Dominik Gabi, James Crnkovich, Jean-Christophe Testud, Kat He, Rashnil Chaturvedi, Wu Zhou, Joshua Saxe | Published: 2025-05-06

LLMセキュリティ

アライメント

プロンプトインジェクション

2025.05.06

文献データベース

Directed Greybox Fuzzing via Large Language Model

Authors: Hanxiang Xu, Yanjie Zhao, Haoyu Wang | Published: 2025-05-06

RAG

プロンプトインジェクション

脆弱性分析

2025.05.06

文献データベース

LLM-Based Threat Detection and Prevention Framework for IoT Ecosystems

Authors: Yazan Otoum, Arghavan Asad, Amiya Nayak | Published: 2025-05-01

AIによる出力のバイアスの検出

LLM性能評価

プロンプトインジェクション

2025.05.01

文献データベース

An Empirical Study on the Effectiveness of Large Language Models for Binary Code Understanding

Authors: Xiuwei Shang, Zhenkan Fu, Shaoyin Cheng, Guoqiang Chen, Gangyang Li, Li Hu, Weiming Zhang, Nenghai Yu | Published: 2025-04-30

プログラム解析

プロンプトインジェクション

プロンプトリーキング

2025.04.30

文献データベース

LASHED: LLMs And Static Hardware Analysis for Early Detection of RTL Bugs

Authors: Baleegh Ahmad, Hammond Pearce, Ramesh Karri, Benjamin Tan | Published: 2025-04-30

プログラム解析

プロンプトインジェクション

脆弱性検出

2025.04.30

文献データベース

XBreaking: Explainable Artificial Intelligence for Jailbreaking LLMs

Authors: Marco Arazzi, Vignesh Kumar Kembu, Antonino Nocera, Vinod P | Published: 2025-04-30

LLMの安全機構の解除

プロンプトインジェクション

説明手法

2025.04.30

文献データベース

ACE: A Security Architecture for LLM-Integrated App Systems

Authors: Evan Li, Tushin Mallick, Evan Rose, William Robertson, Alina Oprea, Cristina Nita-Rotaru | Published: 2025-04-29

インダイレクトプロンプトインジェクション

プロンプトインジェクション

情報フロー分析

2025.04.29

文献データベース

Token-Efficient Prompt Injection Attack: Provoking Cessation in LLM Reasoning via Adaptive Token Compression

Authors: Yu Cui, Yujun Cai, Yiwei Wang | Published: 2025-04-29

トークン圧縮フレームワーク

プロンプトインジェクション

攻撃手法

2025.04.29

文献データベース

Steering the CensorShip: Uncovering Representation Vectors for LLM “Thought” Control

Authors: Hannah Cyberey, David Evans | Published: 2025-04-23

プロンプトインジェクション

心理的操作

透かし

2025.04.23

文献データベース