AIセキュリティポータルbot | Page 101

Protecting Your LLMs with Information Bottleneck

Authors: Zichuan Liu, Zefan Wang, Linjie Xu, Jinyu Wang, Lei Song, Tianchun Wang, Chunlin Chen, Wei Cheng, Jiang Bian | Published: 2024-04-22 | Updated: 2024-10-10

LLM Security

Prompt Injection

Compliance with Ethical Guidelines

2024.04.22 2025.05.27

Literature Database

Competition Report: Finding Universal Jailbreak Backdoors in Aligned LLMs

Authors: Javier Rando, Francesco Croce, Kryštof Mitka, Stepan Shabalin, Maksym Andriushchenko, Nicolas Flammarion, Florian Tramèr | Published: 2024-04-22 | Updated: 2024-06-06

LLM Security

Backdoor Attack

Prompt Injection

2024.04.22 2025.05.27

Literature Database

AdvPrompter: Fast Adaptive Adversarial Prompting for LLMs

Authors: Anselm Paulus, Arman Zharmagambetov, Chuan Guo, Brandon Amos, Yuandong Tian | Published: 2024-04-21

LLM Security

Prompt Injection

Prompt Engineering

2024.04.21 2025.05.27

Literature Database

Reliable Model Watermarking: Defending Against Theft without Compromising on Evasion

Authors: Hongyu Zhu, Sichu Liang, Wentao Hu, Fangqi Li, Ju Jia, Shilin Wang | Published: 2024-04-21

Membership Inference

Watermark Robustness

Watermark Evaluation

2024.04.21 2025.05.27

Literature Database

PristiQ: A Co-Design Framework for Preserving Data Security of Quantum Learning in the Cloud

Authors: Zhepeng Wang, Yi Sheng, Nirajan Koirala, Kanad Basu, Taeho Jung, Cheng-Chang Lu, Weiwen Jiang | Published: 2024-04-20

Watermarking

Quantum Framework

Quantum Cryptography Technology

2024.04.20 2025.05.27

Literature Database

Evaluating the Effectiveness of LLMs in Introductory Computer Science Education: A Semester-Long Field Study

Authors: Wenhan Lyu, Yimeng Wang, Tingting, Chung, Yifan Sun, Yixuan Zhang | Published: 2024-04-20 | Updated: 2024-05-03

Data Extraction and Analysis

Human-Centered Computing

Education and Follow-up

2024.04.20 2025.05.27

Literature Database

Intrusion Detection at Scale with the Assistance of a Command-line Language Model

Authors: Jiongliang Lin, Yiwen Guo, Hao Chen | Published: 2024-04-20

Command Analysis

Anomaly Detection Method

Automated Intrusion Detection System

2024.04.20 2025.05.27

Literature Database

CyberSecEval 2: A Wide-Ranging Cybersecurity Evaluation Suite for Large Language Models

Authors: Manish Bhatt, Sahana Chennabasappa, Yue Li, Cyrus Nikolaidis, Daniel Song, Shengye Wan, Faizan Ahmad, Cornelius Aschermann, Yaohui Chen, Dhaval Kapil, David Molnar, Spencer Whitman, Joshua Saxe | Published: 2024-04-19

LLM Security

Cybersecurity

Prompt Injection

2024.04.19 2025.05.27

Literature Database

Physical Backdoor Attack can Jeopardize Driving with Vision-Large-Language Models

Authors: Zhenyang Ni, Rui Ye, Yuxi Wei, Zhen Xiang, Yanfeng Wang, Siheng Chen | Published: 2024-04-19 | Updated: 2024-04-22

Backdoor Attack

Vulnerabilities in Autonomous Driving Technology

2024.04.19 2025.05.27

Literature Database

Ransomware Detection and Classification Using Random Forest: A Case Study with the UGRansome2024 Dataset

Authors: Peace Azugo, Hein Venter, Mike Wa Nkongolo | Published: 2024-04-19

Cybersecurity

Dataset Generation

Ransomware Assessment

2024.04.19 2025.05.27

Literature Database