プロンプトインジェクション

Do We Really Need Curated Malicious Data for Safety Alignment in Multi-modal Large Language Models?

Authors: Yanbo Wang, Jiyang Guan, Jian Liang, Ran He | Published: 2025-04-14

プロンプトインジェクション

学習データの偏り

安全性アライメント

2025.04.14

文献データベース

An Investigation of Large Language Models and Their Vulnerabilities in Spam Detection

Authors: Qiyao Tang, Xiangyang Li | Published: 2025-04-14

LLM性能評価

プロンプトインジェクション

モデルDoS

2025.04.14

文献データベース

CheatAgent: Attacking LLM-Empowered Recommender Systems via LLM Agent

Authors: Liang-bo Ning, Shijie Wang, Wenqi Fan, Qing Li, Xin Xu, Hao Chen, Feiran Huang | Published: 2025-04-13 | Updated: 2025-04-24

インダイレクトプロンプトインジェクション

プロンプトインジェクション

攻撃者の行動分析

2025.04.13

文献データベース

Sugar-Coated Poison: Benign Generation Unlocks LLM Jailbreaking

Authors: Yu-Hang Wu, Yu-Jie Xiong, Jie-Zhang | Published: 2025-04-08

LLMの応用

プロンプトインジェクション

大規模言語モデル

2025.04.08

文献データベース

Generative Large Language Model usage in Smart Contract Vulnerability Detection

Authors: Peter Ince, Jiangshan Yu, Joseph K. Liu, Xiaoning Du | Published: 2025-04-07

プロンプトインジェクション

プロンプトリーキング

脆弱性分析

2025.04.07

文献データベース

Representation Bending for Large Language Model Safety

Authors: Ashkan Yousefpour, Taeheon Kim, Ryan S. Kwon, Seungbeen Lee, Wonje Jeung, Seungju Han, Alvin Wan, Harrison Ngan, Youngjae Yu, Jonghyun Choi | Published: 2025-04-02

プロンプトインジェクション

プロンプトリーキング

安全性アライメント

2025.04.02

文献データベース

LightDefense: A Lightweight Uncertainty-Driven Defense against Jailbreaks via Shifted Token Distribution

Authors: Zhuoran Yang, Jie Peng, Zhen Tan, Tianlong Chen, Yanyong Zhang | Published: 2025-04-02

プロンプトインジェクション

モデル性能評価

不確実性測定

2025.04.02

文献データベース

No Free Lunch with Guardrails

Authors: Divyanshu Kumar, Nitin Aravind Birur, Tanay Baswa, Sahil Agarwal, Prashanth Harshangi | Published: 2025-04-01 | Updated: 2025-04-03

プロンプトインジェクション

モデルDoS

情報セキュリティ

2025.04.01

文献データベース

Output Constraints as Attack Surface: Exploiting Structured Generation to Bypass LLM Safety Mechanisms

Authors: Shuoming Zhang, Jiacheng Zhao, Ruiyuan Xu, Xiaobing Feng, Huimin Cui | Published: 2025-03-31

LLMセキュリティ

LLMの安全機構の解除

プロンプトインジェクション

2025.03.31 2025.04.03

文献データベース

Detecting Functional Bugs in Smart Contracts through LLM-Powered and Bug-Oriented Composite Analysis

Authors: Binbin Zhao, Xingshuang Lin, Yuan Tian, Saman Zonouz, Na Ruan, Jiliang Li, Raheem Beyah, Shouling Ji | Published: 2025-03-31

インダイレクトプロンプトインジェクション

スマートコントラクト監査

プロンプトインジェクション

2025.03.31 2025.04.03

文献データベース