AIセキュリティポータルbot | ページ 76 | AIセキュリティポータル

Instructional Segment Embedding: Improving LLM Safety with Instruction Hierarchy

Authors: Tong Wu, Shujian Zhang, Kaiqiang Song, Silei Xu, Sanqiang Zhao, Ravi Agrawal, Sathish Reddy Indurthi, Chong Xiang, Prateek Mittal, Wenxuan Zhou | Published: 2024-10-09

LLM性能評価

プロンプトインジェクション

2024.10.09 2025.04.03

文献データベース

Data Taggants: Dataset Ownership Verification via Harmless Targeted Data Poisoning

Authors: Wassim Bouaziz, El-Mahdi El-Mhamdi, Nicolas Usunier | Published: 2024-10-09

ポイズニング

2024.10.09 2025.04.03

文献データベース

Diffuse or Confuse: A Diffusion Deepfake Speech Dataset

Authors: Anton Firc, Kamil Malinka, Petr Hanáček | Published: 2024-10-09

データセット生成

モデル性能評価

音声合成技術

2024.10.09 2025.04.03

文献データベース

Prompt Infection: LLM-to-LLM Prompt Injection within Multi-Agent Systems

Authors: Donghyun Lee, Mo Tiwari | Published: 2024-10-09

プロンプトインジェクション

攻撃手法

防御手法

2024.10.09 2025.04.03

文献データベース

FreqMark: Frequency-Based Watermark for Sentence-Level Detection of LLM-Generated Text

Authors: Zhenyu Xu, Kun Zhang, Victor S. Sheng | Published: 2024-10-09

ウォーターマーキング

透かしの耐久性

透かし評価

2024.10.09 2025.04.03

文献データベース

Signal Watermark on Large Language Models

Authors: Zhenyu Xu, Victor S. Sheng | Published: 2024-10-09

LLM性能評価

ウォーターマーキング

透かし評価

2024.10.09 2025.04.03

文献データベース

Hallucinating AI Hijacking Attack: Large Language Models and Malicious Code Recommenders

Authors: David Noever, Forrest McKee | Published: 2024-10-09

サイバーセキュリティ

プロンプトインジェクション

攻撃手法

2024.10.09 2025.04.03

文献データベース

Near Exact Privacy Amplification for Matrix Mechanisms

Authors: Christopher A. Choquette-Choo, Arun Ganesh, Saminul Haque, Thomas Steinke, Abhradeep Thakurta | Published: 2024-10-08 | Updated: 2025-03-20

プライバシー保護

プライバシー保護手法

2024.10.08 2025.04.03

文献データベース

KnowledgeSG: Privacy-Preserving Synthetic Text Generation with Knowledge Distillation from Server

Authors: Wenhao Wang, Xiaoyu Liang, Rui Ye, Jingyi Chai, Siheng Chen, Yanfeng Wang | Published: 2024-10-08 | Updated: 2024-10-10

プライバシー保護

プライバシー保護手法

2024.10.08 2025.04.03

文献データベース

Superficial Safety Alignment Hypothesis

Authors: Jianwei Li, Jung-Eun Kim | Published: 2024-10-07

LLM性能評価

安全性アライメント

2024.10.07 2025.04.03

文献データベース