A Survey on Responsible LLMs: Inherent Risk, Malicious Use, and Mitigation Strategy Authors: Huandong Wang, Wenjie Fu, Yingzhou Tang, Zhilong Chen, Yuxi Huang, Jinghua Piao, Chen Gao, Fengli Xu, Tao Jiang, Yong Li | Published: 2025-01-16 サーベイ論文プライバシー保護プロンプトインジェクション大規模言語モデル 2025.01.16 2025.04.03 文献データベース
Unveiling Provider Bias in Large Language Models for Code Generation Authors: Xiaoyu Zhang, Juan Zhai, Shiqing Ma, Qingshuang Bao, Weipeng Jiang, Chao Shen, Yang Liu | Published: 2025-01-14 コード生成バイアスプロンプトインジェクション 2025.01.14 2025.04.03 文献データベース
Automating the Detection of Code Vulnerabilities by Analyzing GitHub Issues Authors: Daniele Cipollone, Changjie Wang, Mariano Scazzariello, Simone Ferlin, Maliheh Izadi, Dejan Kostic, Marco Chiesa | Published: 2025-01-09 LLM性能評価プロンプトインジェクション脆弱性管理 2025.01.09 2025.04.03 文献データベース
SpaLLM-Guard: Pairing SMS Spam Detection Using Open-source and Commercial LLMs Authors: Muhammad Salman, Muhammad Ikram, Nardine Basta, Mohamed Ali Kaafar | Published: 2025-01-09 LLM性能評価プロンプトインジェクション学習の改善 2025.01.09 2025.04.03 文献データベース
Jailbreaking Multimodal Large Language Models via Shuffle Inconsistency Authors: Shiji Zhao, Ranjie Duan, Fengxiang Wang, Chi Chen, Caixin Kang, Jialing Tao, YueFeng Chen, Hui Xue, Xingxing Wei | Published: 2025-01-09 テキストシャッフル不整合プロンプトインジェクション攻撃手法 2025.01.09 2025.04.03 文献データベース
Exploring Large Language Models for Semantic Analysis and Categorization of Android Malware Authors: Brandon J Walton, Mst Eshita Khatun, James M Ghawaly, Aisha Ali-Gombe | Published: 2025-01-08 プロンプトインジェクションプロンプトエンジニアリングマルウェア分類 2025.01.08 2025.04.03 文献データベース
PromptGuard: Soft Prompt-Guided Unsafe Content Moderation for Text-to-Image Models Authors: Lingzhi Yuan, Xinfeng Li, Chejian Xu, Guanhong Tao, Xiaojun Jia, Yihao Huang, Wei Dong, Yang Liu, XiaoFeng Wang, Bo Li | Published: 2025-01-07 コンテンツモデレーションソフトプロンプト最適化プロンプトインジェクション 2025.01.07 2025.04.03 文献データベース
RTLMarker: Protecting LLM-Generated RTL Copyright via a Hardware Watermarking Framework Authors: Kun Wang, Kaiyan Chang, Mengdi Wang, Xinqi Zou, Haobo Xu, Yinhe Han, Ying Wang | Published: 2025-01-05 プロンプトインジェクション透かしの耐久性透かし評価 2025.01.05 2025.04.03 文献データベース
GNSS/GPS Spoofing and Jamming Identification Using Machine Learning and Deep Learning Authors: Ali Ghanbarzade, Hossein Soleimani | Published: 2025-01-04 GNSSセキュリティプロンプトインジェクションラベル 2025.01.04 2025.04.03 文献データベース
Auto-RT: Automatic Jailbreak Strategy Exploration for Red-Teaming Large Language Models Authors: Yanjiang Liu, Shuhen Zhou, Yaojie Lu, Huijia Zhu, Weiqiang Wang, Hongyu Lin, Ben He, Xianpei Han, Le Sun | Published: 2025-01-03 フレームワークプロンプトインジェクション攻撃手法 2025.01.03 2025.04.03 文献データベース