CPA-RAG:Covert Poisoning Attacks on Retrieval-Augmented Generation in Large Language Models Authors: Chunyang Li, Junwei Zhang, Anda Cheng, Zhuo Ma, Xinghua Li, Jianfeng Ma | Published: 2025-05-26 RAGへのポイズニング攻撃テキスト生成手法ポイズニング攻撃 2025.05.26 文献データベース
BitHydra: Towards Bit-flip Inference Cost Attack against Large Language Models Authors: Xiaobei Yan, Yiming Li, Zhaoxin Fan, Han Qiu, Tianwei Zhang | Published: 2025-05-22 LLMセキュリティテキスト生成手法プロンプトインジェクション 2025.05.22 文献データベース
Blind Spot Navigation: Evolutionary Discovery of Sensitive Semantic Concepts for LVLMs Authors: Zihao Pan, Yu Tong, Weibin Wu, Jingyi Wang, Lifeng Chen, Zhe Zhao, Jiajia Wei, Yitong Qiao, Zibin Zheng | Published: 2025-05-21 テキスト生成手法プロンプトリーキング視覚化の脆弱性 2025.05.21 文献データベース
MorphMark: Flexible Adaptive Watermarking for Large Language Models Authors: Zongqi Wang, Tianle Gu, Baoyuan Wu, Yujiu Yang | Published: 2025-05-14 | Updated: 2025-05-20 テキスト生成手法生成AI向け電子透かし透かしの耐久性 2025.05.14 文献データベース
AutoRedTeamer: Autonomous Red Teaming with Lifelong Attack Integration Authors: Andy Zhou, Kevin Wu, Francesco Pinto, Zhaorun Chen, Yi Zeng, Yu Yang, Shuang Yang, Sanmi Koyejo, James Zou, Bo Li | Published: 2025-03-20 エラー処理テキスト生成手法テストケース生成 2025.03.20 2025.04.03 文献データベース
SEA: Low-Resource Safety Alignment for Multimodal Large Language Models via Synthetic Embeddings Authors: Weikai Lu, Hao Peng, Huiping Zhuang, Cen Chen, Ziqian Zeng | Published: 2025-02-18 | Updated: 2025-05-21 アライメントテキスト生成手法プロンプトインジェクション 2025.02.18 文献データベース
ChatNVD: Advancing Cybersecurity Vulnerability Assessment with Large Language Models Authors: Shivansh Chopra, Hussain Ahmad, Diksha Goel, Claudia Szabo | Published: 2024-12-06 | Updated: 2025-05-20 テキスト生成手法プロンプトインジェクション計算効率 2024.12.06 文献データベース
Model-based Large Language Model Customization as Service Authors: Zhaomin Wu, Jizhou Guo, Junyi Hou, Bingsheng He, Lixin Fan, Qiang Yang | Published: 2024-10-14 | Updated: 2025-05-22 テキスト生成手法プライバシー管理差分プライバシー 2024.10.14 文献データベース
OD-Stega: LLM-Based Near-Imperceptible Steganography via Optimized Distributions Authors: Yu-Shin Huang, Peter Just, Krishna Narayanan, Chao Tian | Published: 2024-10-06 テキスト生成手法最適化問題 2024.10.06 2025.04.03 文献データベース
Adversarial Text Purification: A Large Language Model Approach for Defense Authors: Raha Moraffah, Shubh Khandelwal, Amrita Bhattacharjee, Huan Liu | Published: 2024-02-05 テキスト生成手法プロンプトインジェクション敵対的テキスト浄化 2024.02.05 2025.04.03 文献データベース