プロンプトリーキング

The Automation Advantage in AI Red Teaming

Authors: Rob Mulla, Will Pearce, Nick Landers, Brian Greunke, Brad Palm, Vincent Abruzzo, Ads Dawson | Published: 2025-04-28

プロンプトリーキング

攻撃手法

自動化の効果

2025.04.28

文献データベース

Automatically Generating Rules of Malicious Software Packages via Large Language Model

Authors: XiangRui Zhang, HaoYu Chen, Yongzhong He, Wenjia Niu, Qiang Li | Published: 2025-04-24

OSSエコシステムの脅威

プロンプトリーキング

マルウェア検出手法

2025.04.24

文献データベース

Case Study: Fine-tuning Small Language Models for Accurate and Private CWE Detection in Python Code

Authors: Md. Azizul Hakim Bappy, Hossen A Mustafa, Prottoy Saha, Rajinus Salehat | Published: 2025-04-23

LLM性能評価

トレーニング手法

プロンプトリーキング

2025.04.23

文献データベース

Can LLMs Handle WebShell Detection? Overcoming Detection Challenges with Behavioral Function-Aware Framework

Authors: Feijiang Han, Jiaming Zhang, Chuyi Deng, Jianheng Tang, Yunhuai Liu | Published: 2025-04-14 | Updated: 2025-08-26

データ生成手法

プログラム解析

プロンプトリーキング

2025.04.14

文献データベース

Select Me! When You Need a Tool: A Black-box Text Attack on Tool Selection

Authors: Liuji Chen, Hao Gao, Jinghao Zhang, Qiang Liu, Shu Wu, Liang Wang | Published: 2025-04-07

プロンプトリーキング

情報セキュリティ

敵対的サンプル

2025.04.07

文献データベース

Generative Large Language Model usage in Smart Contract Vulnerability Detection

Authors: Peter Ince, Jiangshan Yu, Joseph K. Liu, Xiaoning Du | Published: 2025-04-07

プロンプトインジェクション

プロンプトリーキング

脆弱性分析

2025.04.07

文献データベース

Representation Bending for Large Language Model Safety

Authors: Ashkan Yousefpour, Taeheon Kim, Ryan S. Kwon, Seungbeen Lee, Wonje Jeung, Seungju Han, Alvin Wan, Harrison Ngan, Youngjae Yu, Jonghyun Choi | Published: 2025-04-02

プロンプトインジェクション

プロンプトリーキング

安全性アライメント

2025.04.02

文献データベース

THEMIS: Towards Practical Intellectual Property Protection for Post-Deployment On-Device Deep Learning Models

Authors: Yujin Huang, Zhi Zhang, Qingchuan Zhao, Xingliang Yuan, Chunyang Chen | Published: 2025-03-31

プロンプトリーキング

モデル保護手法

モデル抽出攻撃

2025.03.31 2025.04.03

文献データベース

Large Language Models are Unreliable for Cyber Threat Intelligence

Authors: Emanuele Mezzi, Fabio Massacci, Katja Tuma | Published: 2025-03-29 | Updated: 2025-07-16

Few-Shot Learning

プロンプトリーキング

性能評価手法

2025.03.29

文献データベース

Large Language Models powered Network Attack Detection: Architecture, Opportunities and Case Study

Authors: Xinggong Zhang, Qingyang Li, Yunpeng Tan, Zongming Guo, Lei Zhang, Yong Cui | Published: 2025-03-24

プロンプトインジェクション

プロンプトリーキング

侵入検知システム

2025.03.24 2025.04.03

文献データベース