ART: Automatic Red-teaming for Text-to-Image Models to Protect Benign Users Authors: Guanlin Li, Kangjie Chen, Shudong Zhang, Jie Zhang, Tianwei Zhang | Published: 2024-05-24 | Updated: 2024-10-11 コンテンツモデレーションプロンプトインジェクション倫理的ガイドライン遵守 2024.05.24 2025.04.03 文献データベース
Cross-Task Defense: Instruction-Tuning LLMs for Content Safety Authors: Yu Fu, Wen Xiao, Jia Chen, Jiachen Li, Evangelos Papalexakis, Aichi Chien, Yue Dong | Published: 2024-05-24 コンテンツモデレーションプロンプトインジェクション防御手法 2024.05.24 2025.04.03 文献データベース
A Comprehensive Overview of Large Language Models (LLMs) for Cyber Defences: Opportunities and Directions Authors: Mohammed Hassanin, Nour Moustafa | Published: 2024-05-23 LLMセキュリティサイバーセキュリティプロンプトインジェクション 2024.05.23 2025.04.03 文献データベース
Generative AI in Cybersecurity: A Comprehensive Review of LLM Applications and Vulnerabilities Authors: Mohamed Amine Ferrag, Fatima Alwahedi, Ammar Battah, Bilel Cherif, Abdechakour Mechri, Norbert Tihanyi, Tamas Bisztray, Merouane Debbah | Published: 2024-05-21 | Updated: 2025-01-17 LLM性能評価サイバーセキュリティプロンプトインジェクション 2024.05.21 2025.04.03 文献データベース
Self-HWDebug: Automation of LLM Self-Instructing for Hardware Security Verification Authors: Mohammad Akyash, Hadi Mardani Kamali | Published: 2024-05-20 セキュリティ分析プロンプトインジェクション脆弱性管理 2024.05.20 2025.04.03 文献データベース
Oedipus: LLM-enchanced Reasoning CAPTCHA Solver Authors: Gelei Deng, Haoran Ou, Yi Liu, Jie Zhang, Tianwei Zhang, Yang Liu | Published: 2024-05-13 CAPTCHAソルバーLLM性能評価プロンプトインジェクション 2024.05.13 2025.04.03 文献データベース
PLeak: Prompt Leaking Attacks against Large Language Model Applications Authors: Bo Hui, Haolin Yuan, Neil Gong, Philippe Burlina, Yinzhi Cao | Published: 2024-05-10 | Updated: 2024-05-14 LLM性能評価プロンプトインジェクションメンバーシップ推論 2024.05.10 2025.04.03 文献データベース
Trustworthy AI-Generative Content in Intelligent 6G Network: Adversarial, Privacy, and Fairness Authors: Siyuan Li, Xi Lin, Yaju Liu, Jianhua Li | Published: 2024-05-09 バイアスプライバシー保護プロンプトインジェクション 2024.05.09 2025.04.03 文献データベース
Chain of Attack: a Semantic-Driven Contextual Multi-Turn attacker for LLM Authors: Xikang Yang, Xuehai Tang, Songlin Hu, Jizhong Han | Published: 2024-05-09 LLMセキュリティプロンプトインジェクション攻撃手法 2024.05.09 2025.04.03 文献データベース
Locally Differentially Private In-Context Learning Authors: Chunyan Zheng, Keke Sun, Wenhao Zhao, Haibo Zhou, Lixin Jiang, Shaoyang Song, Chunlai Zhou | Published: 2024-05-07 | Updated: 2024-05-08 ウォーターマーキングプライバシー保護手法プロンプトインジェクション 2024.05.07 2025.04.03 文献データベース