SmoothLLM: Defending Large Language Models Against Jailbreaking Attacks Authors: Alexander Robey, Eric Wong, Hamed Hassani, George J. Pappas | Published: 2023-10-05 | Updated: 2024-06-11 LLM性能評価プロンプトインジェクション防御手法 2023.10.05 2025.04.03 文献データベース
The Anatomy of Deception: Technical and Human Perspectives on a Large-scale Phishing Campaign Authors: Anargyros Chrysanthou, Yorgos Pantis, Constantinos Patsakis | Published: 2023-10-05 データ収集ユーザー活動解析被害者統計 2023.10.05 2025.04.03 文献データベース
Misusing Tools in Large Language Models With Visual Adversarial Examples Authors: Xiaohan Fu, Zihan Wang, Shuheng Li, Rajesh K. Gupta, Niloofar Mireshghallah, Taylor Berg-Kirkpatrick, Earlence Fernandes | Published: 2023-10-04 LLM性能評価プロンプトインジェクション敵対的サンプル 2023.10.04 2025.04.03 文献データベース
Raze to the Ground: Query-Efficient Adversarial HTML Attacks on Machine-Learning Phishing Webpage Detectors Authors: Biagio Montaruli, Luca Demetrio, Maura Pintor, Luca Compagna, Davide Balzarotti, Battista Biggio | Published: 2023-10-04 | Updated: 2023-10-14 フィッシングポイズニング機械学習手法 2023.10.04 2025.04.03 文献データベース
Crossed-IoT device portability of Electromagnetic Side Channel Analysis: Challenges and Dataset Authors: Tharindu Lakshan Yasarathna, Lojenaa Navanesan, Simon Barque, Assanka Sayakkara, Nhien-An Le-Khac | Published: 2023-10-04 ウォーターマーキングクロスデバイス分析分類パターン分析 2023.10.04 2025.04.03 文献データベース
Shadow Alignment: The Ease of Subverting Safely-Aligned Language Models Authors: Xianjun Yang, Xiao Wang, Qi Zhang, Linda Petzold, William Yang Wang, Xun Zhao, Dahua Lin | Published: 2023-10-04 プロンプトインジェクション安全性アライメント悪意のあるコンテンツ生成 2023.10.04 2025.04.03 文献データベース
AGIR: Automating Cyber Threat Intelligence Reporting with Natural Language Generation Authors: Filippo Perrina, Francesco Marchiori, Mauro Conti, Nino Vincenzo Verde | Published: 2023-10-04 データ生成脅威モデリング評価指標 2023.10.04 2025.04.03 文献データベース
Practical, Private Assurance of the Value of Collaboration via Fully Homomorphic Encryption Authors: Hassan Jameel Asghar, Zhigang Lu, Zhongrui Zhao, Dali Kaafar | Published: 2023-10-04 | Updated: 2024-10-07 ウォーターマーキングプライバシー保護損失関数 2023.10.04 2025.04.03 文献データベース
zkFL: Zero-Knowledge Proof-based Gradient Aggregation for Federated Learning Authors: Zhipeng Wang, Nanqing Dong, Jiahao Sun, William Knottenbelt, Yike Guo | Published: 2023-10-04 | Updated: 2024-05-10 ウォーターマーキングプライバシー保護連合学習 2023.10.04 2025.04.03 文献データベース
Low-Resource Languages Jailbreak GPT-4 Authors: Zheng-Xin Yong, Cristina Menghini, Stephen H. Bach | Published: 2023-10-03 | Updated: 2024-01-27 プロンプトインジェクション安全性アライメント脆弱性検出 2023.10.03 2025.04.03 文献データベース