文献データベース

SmoothLLM: Defending Large Language Models Against Jailbreaking Attacks

Authors: Alexander Robey, Eric Wong, Hamed Hassani, George J. Pappas | Published: 2023-10-05 | Updated: 2024-06-11

LLM性能評価

プロンプトインジェクション

防御手法

2023.10.05 2025.04.03

文献データベース

The Anatomy of Deception: Technical and Human Perspectives on a Large-scale Phishing Campaign

Authors: Anargyros Chrysanthou, Yorgos Pantis, Constantinos Patsakis | Published: 2023-10-05

データ収集

ユーザー活動解析

被害者統計

2023.10.05 2025.04.03

文献データベース

Misusing Tools in Large Language Models With Visual Adversarial Examples

Authors: Xiaohan Fu, Zihan Wang, Shuheng Li, Rajesh K. Gupta, Niloofar Mireshghallah, Taylor Berg-Kirkpatrick, Earlence Fernandes | Published: 2023-10-04

LLM性能評価

プロンプトインジェクション

敵対的サンプル

2023.10.04 2025.04.03

文献データベース

Raze to the Ground: Query-Efficient Adversarial HTML Attacks on Machine-Learning Phishing Webpage Detectors

Authors: Biagio Montaruli, Luca Demetrio, Maura Pintor, Luca Compagna, Davide Balzarotti, Battista Biggio | Published: 2023-10-04 | Updated: 2023-10-14

フィッシング

ポイズニング

機械学習手法

2023.10.04 2025.04.03

文献データベース

Crossed-IoT device portability of Electromagnetic Side Channel Analysis: Challenges and Dataset

Authors: Tharindu Lakshan Yasarathna, Lojenaa Navanesan, Simon Barque, Assanka Sayakkara, Nhien-An Le-Khac | Published: 2023-10-04

ウォーターマーキング

クロスデバイス分析

分類パターン分析

2023.10.04 2025.04.03

文献データベース

Shadow Alignment: The Ease of Subverting Safely-Aligned Language Models

Authors: Xianjun Yang, Xiao Wang, Qi Zhang, Linda Petzold, William Yang Wang, Xun Zhao, Dahua Lin | Published: 2023-10-04

プロンプトインジェクション

安全性アライメント

悪意のあるコンテンツ生成

2023.10.04 2025.04.03

文献データベース

AGIR: Automating Cyber Threat Intelligence Reporting with Natural Language Generation

Authors: Filippo Perrina, Francesco Marchiori, Mauro Conti, Nino Vincenzo Verde | Published: 2023-10-04

データ生成

脅威モデリング

評価指標

2023.10.04 2025.04.03

文献データベース

Practical, Private Assurance of the Value of Collaboration via Fully Homomorphic Encryption

Authors: Hassan Jameel Asghar, Zhigang Lu, Zhongrui Zhao, Dali Kaafar | Published: 2023-10-04 | Updated: 2024-10-07

ウォーターマーキング

プライバシー保護

損失関数

2023.10.04 2025.04.03

文献データベース

zkFL: Zero-Knowledge Proof-based Gradient Aggregation for Federated Learning

Authors: Zhipeng Wang, Nanqing Dong, Jiahao Sun, William Knottenbelt, Yike Guo | Published: 2023-10-04 | Updated: 2024-05-10

ウォーターマーキング

プライバシー保護

連合学習

2023.10.04 2025.04.03

文献データベース

Low-Resource Languages Jailbreak GPT-4

Authors: Zheng-Xin Yong, Cristina Menghini, Stephen H. Bach | Published: 2023-10-03 | Updated: 2024-01-27

プロンプトインジェクション

安全性アライメント

脆弱性検出

2023.10.03 2025.04.03

文献データベース