プロンプトリーキング

MAD-Spear: A Conformity-Driven Prompt Injection Attack on Multi-Agent Debate Systems

Authors: Yu Cui, Hongyang Du | Published: 2025-07-17

セキュリティ戦略生成

プロンプトリーキング

攻撃者の行動分析

2025.07.17

文献データベース

The Man Behind the Sound: Demystifying Audio Private Attribute Profiling via Multimodal Large Language Model Agents

Authors: Lixu Wang, Kaixiang Yao, Xinfeng Li, Dong Yang, Haoyang Li, Xiaofeng Wang, Wei Dong | Published: 2025-07-14 | Updated: 2025-08-20

プライバシー設計原則

プロンプトリーキング

音声認識システムのセキュリティ

2025.07.14

文献データベース

Defending Against Prompt Injection With a Few DefensiveTokens

Authors: Sizhe Chen, Yizhu Wang, Nicholas Carlini, Chawin Sitawarin, David Wagner | Published: 2025-07-10

インダイレクトプロンプトインジェクション

プロンプトリーキング

防御手法

2025.07.10

文献データベース

PenTest2.0: Towards Autonomous Privilege Escalation Using GenAI

Authors: Haitham S. Al-Sinani, Chris J. Mitchell | Published: 2025-07-09

インダイレクトプロンプトインジェクション

プロンプトの検証

プロンプトリーキング

2025.07.09

文献データベース

The Landscape of Memorization in LLMs: Mechanisms, Measurement, and Mitigation

Authors: Alexander Xiong, Xuandong Zhao, Aneesh Pappu, Dawn Song | Published: 2025-07-08

プロンプトリーキング

メモリ化メカニズム

大規模言語モデル

2025.07.08

文献データベース

VERA: Variational Inference Framework for Jailbreaking Large Language Models

Authors: Anamika Lochab, Lu Yan, Patrick Pynadath, Xiangyu Zhang, Ruqi Zhang | Published: 2025-06-27 | Updated: 2025-11-06

プロンプトインジェクション

プロンプトリーキング

生成モデルの課題

2025.06.27

文献データベース

Smart-LLaMA-DPO: Reinforced Large Language Model for Explainable Smart Contract Vulnerability Detection

Authors: Lei Yu, Zhirong Huang, Hang Yuan, Shiqi Cheng, Li Yang, Fengjun Zhang, Chenjie Shen, Jiajia Ma, Jingyuan Zhang, Junyi Lu, Chun Zuo | Published: 2025-06-23

スマートコントラクト脆弱性

プロンプトリーキング

大規模言語モデル

2025.06.23

文献データベース

Watermarking LLM-Generated Datasets in Downstream Tasks

Authors: Yugeng Liu, Tianshuo Cong, Michael Backes, Zheng Li, Yang Zhang | Published: 2025-06-16

プロンプトリーキング

モデル保護手法

生成AI向け電子透かし

2025.06.16

文献データベース

Using LLMs for Security Advisory Investigations: How Far Are We?

Authors: Bayu Fedra Abdullah, Yusuf Sulistyo Nugroho, Brittany Reid, Raula Gaikovina Kula, Kazumasa Shimari, Kenichi Matsumoto | Published: 2025-06-16

アドバイス提供

ハルシネーション

プロンプトリーキング

2025.06.16

文献データベース

Detecting Hard-Coded Credentials in Software Repositories via LLMs

Authors: Chidera Biringa, Gokhan Kul | Published: 2025-06-16

ソフトウェアセキュリティ

パフォーマンス評価

プロンプトリーキング

2025.06.16

文献データベース