プロンプトインジェクション

LeCov: Multi-level Testing Criteria for Large Language Models

Authors: Xuan Xie, Jiayang Song, Yuheng Huang, Da Song, Fuyuan Zhang, Felix Juefei-Xu, Lei Ma | Published: 2024-08-20

LLM性能評価

テスト優先順位付け

プロンプトインジェクション

2024.08.20 2025.04.03

文献データベース

Antidote: Post-fine-tuning Safety Alignment for Large Language Models against Harmful Fine-tuning

Authors: Tiansheng Huang, Gautam Bhattacharya, Pratik Joshi, Josh Kimball, Ling Liu | Published: 2024-08-18 | Updated: 2024-09-03

LLMセキュリティ

プロンプトインジェクション

安全性アライメント

2024.08.18 2025.04.03

文献データベース

MIA-Tuner: Adapting Large Language Models as Pre-training Text Detector

Authors: Wenjie Fu, Huandong Wang, Chen Gao, Guanghua Liu, Yong Li, Tao Jiang | Published: 2024-08-16

LLMセキュリティ

プロンプトインジェクション

メンバーシップ推論

2024.08.16 2025.04.03

文献データベース

PatUntrack: Automated Generating Patch Examples for Issue Reports without Tracked Insecure Code

Authors: Ziyou Jiang, Lin Shi, Guowei Yang, Qing Wang | Published: 2024-08-16

コード生成

プロンプトインジェクション

脆弱性管理

2024.08.16 2025.04.03

文献データベース

DePrompt: Desensitization and Evaluation of Personal Identifiable Information in Large Language Model Prompts

Authors: Xiongtao Sun, Gan Liu, Zhipeng He, Hui Li, Xiaoguang Li | Published: 2024-08-16

LLMセキュリティ

プライバシー保護手法

プロンプトインジェクション

2024.08.16 2025.04.03

文献データベース

Prefix Guidance: A Steering Wheel for Large Language Models to Defend Against Jailbreak Attacks

Authors: Jiawei Zhao, Kejiang Chen, Xiaojian Yuan, Weiming Zhang | Published: 2024-08-15 | Updated: 2024-08-22

LLMセキュリティ

プロンプトインジェクション

防御手法

2024.08.15 2025.04.03

文献データベース

LLM-Enhanced Static Analysis for Precise Identification of Vulnerable OSS Versions

Authors: Yiran Cheng, Lwin Khin Shar, Ting Zhang, Shouguo Yang, Chaopeng Dong, David Lo, Shichao Lv, Zhiqiang Shi, Limin Sun | Published: 2024-08-14

コード変更分析

プロンプトインジェクション

脆弱性管理

2024.08.14 2025.04.03

文献データベース

Casper: Prompt Sanitization for Protecting User Privacy in Web-Based Large Language Models

Authors: Chun Jie Chong, Chenxi Hou, Zhihao Yao, Seyed Mohammadjavad Seyed Talebi | Published: 2024-08-13

LLMセキュリティ

プライバシー保護

プロンプトインジェクション

2024.08.13 2025.04.03

文献データベース

Large Language Models for Secure Code Assessment: A Multi-Language Empirical Study

Authors: Kohei Dozono, Tiago Espinha Gasiba, Andrea Stocco | Published: 2024-08-12

LLM性能評価

プロンプトインジェクション

脆弱性管理

2024.08.12 2025.04.03

文献データベース

Audit-LLM: Multi-Agent Collaboration for Log-based Insider Threat Detection

Authors: Chengyu Song, Linru Ma, Jianming Zheng, Jinzhi Liao, Hongyu Kuang, Lin Yang | Published: 2024-08-12

プロンプトインジェクション

モデル性能評価

ログ解析手法

2024.08.12 2025.04.03

文献データベース