プロンプトインジェクション

What is in Your Safe Data? Identifying Benign Data that Breaks Safety

Authors: Luxi He, Mengzhou Xia, Peter Henderson | Published: 2024-04-01 | Updated: 2024-08-20

データ選択戦略

プロンプトインジェクション

心理的操作

2024.04.01 2025.04.03

文献データベース

To Err is Machine: Vulnerability Detection Challenges LLM Reasoning

Authors: Benjamin Steenhoek, Md Mahbubur Rahman, Monoshi Kumar Roy, Mirza Sanjida Alam, Hengbo Tong, Swarna Das, Earl T. Barr, Wei Le | Published: 2024-03-25 | Updated: 2025-01-07

DoS対策

LLMセキュリティ

プロンプトインジェクション

2024.03.25 2025.04.03

文献データベース

Defending Against Indirect Prompt Injection Attacks With Spotlighting

Authors: Keegan Hines, Gary Lopez, Matthew Hall, Federico Zarfati, Yonatan Zunger, Emre Kiciman | Published: 2024-03-20

インダイレクトプロンプトインジェクション

プロンプトインジェクション

悪意のあるプロンプト

2024.03.20 2025.04.03

文献データベース

Leveraging Large Language Models to Detect npm Malicious Packages

Authors: Nusrat Zahan, Philipp Burckhardt, Mikola Lysenko, Feross Aboukhadijeh, Laurie Williams | Published: 2024-03-18 | Updated: 2025-01-06

LLM性能評価

プロンプトインジェクション

マルウェア分類

2024.03.18 2025.04.03

文献データベース

Helpful or Harmful? Exploring the Efficacy of Large Language Models for Online Grooming Prevention

Authors: Ellie Prosser, Matthew Edwards | Published: 2024-03-14

LLM性能評価

オンライン安全性アドバイス

プロンプトインジェクション

2024.03.14 2025.04.03

文献データベース

AdaShield: Safeguarding Multimodal Large Language Models from Structure-based Attack via Adaptive Shield Prompting

Authors: Yu Wang, Xiaogeng Liu, Yu Li, Muhao Chen, Chaowei Xiao | Published: 2024-03-14

プロンプトインジェクション

構造的攻撃

防御手法

2024.03.14 2025.04.03

文献データベース

CodeAttack: Revealing Safety Generalization Challenges of Large Language Models via Code Completion

Authors: Qibing Ren, Chang Gao, Jing Shao, Junchi Yan, Xin Tan, Wai Lam, Lizhuang Ma | Published: 2024-03-12 | Updated: 2024-09-14

LLMセキュリティ

コード生成

プロンプトインジェクション

2024.03.12 2025.04.03

文献データベース

ACFIX: Guiding LLMs with Mined Common RBAC Practices for Context-Aware Repair of Access Control Vulnerabilities in Smart Contracts

Authors: Lyuye Zhang, Kaixuan Li, Kairan Sun, Daoyuan Wu, Ye Liu, Haoye Tian, Yang Liu | Published: 2024-03-11 | Updated: 2024-03-18

スマートコントラクト

プロンプトインジェクション

自動脆弱性修復

2024.03.11 2025.04.03

文献データベース

DP-TabICL: In-Context Learning with Differentially Private Tabular Data

Authors: Alycia N. Carey, Karuna Bhaila, Kennedy Edemacu, Xintao Wu | Published: 2024-03-08

Few-Shot Learning

プライバシー保護手法

プロンプトインジェクション

2024.03.08 2025.04.03

文献データベース

On Protecting the Data Privacy of Large Language Models (LLMs): A Survey

Authors: Biwei Yan, Kun Li, Minghui Xu, Yueyan Dong, Yue Zhang, Zhaochun Ren, Xiuzhen Cheng | Published: 2024-03-08 | Updated: 2024-03-14

バックドア攻撃

プライバシー保護手法

プロンプトインジェクション

2024.03.08 2025.04.03

文献データベース