プロンプトインジェクション

Exploring User Privacy Awareness on GitHub: An Empirical Study

Authors: Costanza Alfieri, Juri Di Rocco, Paola Inverardi, Phuong T. Nguyen | Published: 2024-09-06 | Updated: 2024-09-10

プライバシー保護

プロンプトインジェクション

ユーザー活動解析

2024.09.06 2025.04.03

文献データベース

RACONTEUR: A Knowledgeable, Insightful, and Portable LLM-Powered Shell Command Explainer

Authors: Jiangyi Deng, Xinfeng Li, Yanjiao Chen, Yijie Bai, Haiqin Weng, Yan Liu, Tao Wei, Wenyuan Xu | Published: 2024-09-03

LLM性能評価

サイバーセキュリティ

プロンプトインジェクション

2024.09.03 2025.04.03

文献データベース

Membership Inference Attacks Against In-Context Learning

Authors: Rui Wen, Zheng Li, Michael Backes, Yang Zhang | Published: 2024-09-02

プロンプトインジェクション

メンバーシップ推論

攻撃手法

2024.09.02 2025.04.03

文献データベース

Unveiling the Vulnerability of Private Fine-Tuning in Split-Based Frameworks for Large Language Models: A Bidirectionally Enhanced Attack

Authors: Guanzhong Chen, Zhenghan Qin, Mingxin Yang, Yajie Zhou, Tao Fan, Tianyu Du, Zenglin Xu | Published: 2024-09-02 | Updated: 2024-09-04

LLMセキュリティ

プロンプトインジェクション

攻撃手法

2024.09.02 2025.04.03

文献データベース

ProphetFuzz: Fully Automated Prediction and Fuzzing of High-Risk Option Combinations with Only Documentation via Large Language Model

Authors: Dawei Wang, Geng Zhou, Li Chen, Dan Li, Yukai Miao | Published: 2024-09-02

オプションに基づくファジング

プロンプトインジェクション

脆弱性管理

2024.09.02 2025.04.03

文献データベース

The Dark Side of Human Feedback: Poisoning Large Language Models via User Inputs

Authors: Bocheng Chen, Hanqing Guo, Guangjing Wang, Yuanda Wang, Qiben Yan | Published: 2024-09-01

LLM性能評価

プロンプトインジェクション

ポイズニング

2024.09.01 2025.04.03

文献データベース

Automatic Pseudo-Harmful Prompt Generation for Evaluating False Refusals in Large Language Models

Authors: Bang An, Sicheng Zhu, Ruiyi Zhang, Michael-Andrei Panaitescu-Liess, Yuancheng Xu, Furong Huang | Published: 2024-09-01

LLM性能評価

コンテンツモデレーション

プロンプトインジェクション

2024.09.01 2025.04.03

文献データベース

LLM Defenses Are Not Robust to Multi-Turn Human Jailbreaks Yet

Authors: Nathaniel Li, Ziwen Han, Ian Steneker, Willow Primack, Riley Goodside, Hugh Zhang, Zifan Wang, Cristina Menghini, Summer Yue | Published: 2024-08-27 | Updated: 2024-09-04

プロンプトインジェクション

ユーザー教育

攻撃手法

2024.08.27 2025.04.03

文献データベース

Is Generative AI the Next Tactical Cyber Weapon For Threat Actors? Unforeseen Implications of AI Generated Cyber Attacks

Authors: Yusuf Usman, Aadesh Upadhyay, Prashnna Gyawali, Robin Chataut | Published: 2024-08-23

サイバーセキュリティ

プロンプトインジェクション

攻撃手法

2024.08.23 2025.04.03

文献データベース

LLM-PBE: Assessing Data Privacy in Large Language Models

Authors: Qinbin Li, Junyuan Hong, Chulin Xie, Jeffrey Tan, Rachel Xin, Junyi Hou, Xavier Yin, Zhun Wang, Dan Hendrycks, Zhangyang Wang, Bo Li, Bingsheng He, Dawn Song | Published: 2024-08-23 | Updated: 2024-09-06

LLMセキュリティ

プライバシー保護手法

プロンプトインジェクション

2024.08.23 2025.04.03

文献データベース