透かし評価

Early Signs of Steganographic Capabilities in Frontier LLMs

Authors: Artur Zolkowski, Kei Nishimura-Gasparian, Robert McCarthy, Roland S. Zimmermann, David Lindner | Published: 2025-07-03

料理手順

透かし評価

隠れタスク評価

2025.07.03

文献データベース

Privacy Leaks by Adversaries: Adversarial Iterations for Membership Inference Attack

Authors: Jing Xue, Zhishen Sun, Haishan Ye, Luo Luo, Xiangyu Chang, Ivor Tsang, Guang Dai | Published: 2025-06-03

プライバシー分析

敵対的サンプル

透かし評価

2025.06.03

文献データベース

CyberGym: Evaluating AI Agents’ Cybersecurity Capabilities with Real-World Vulnerabilities at Scale

Authors: Zhun Wang, Tianneng Shi, Jingxuan He, Matthew Cai, Jialin Zhang, Dawn Song | Published: 2025-06-03

プロンプトインジェクション

動的分析手法

透かし評価

2025.06.03

文献データベース

UniNet: A Unified Multi-granular Traffic Modeling Framework for Network Security

Authors: Binghui Wu, Dinil Mon Divakaran, Mohan Gurusamy | Published: 2025-03-06 | Updated: 2025-07-03

IoTトラフィック分析

ネットワークトラフィックの変更

透かし評価

2025.03.06

文献データベース

RAG-WM: An Efficient Black-Box Watermarking Approach for Retrieval-Augmented Generation of Large Language Models

Authors: Peizhuo Lv, Mengjie Sun, Hao Wang, Xiaofeng Wang, Shengzhi Zhang, Yuxuan Chen, Kai Chen, Limin Sun | Published: 2025-01-09

RAG

ウォーターマーキング

透かし評価

2025.01.09 2025.04.03

文献データベース

RTLMarker: Protecting LLM-Generated RTL Copyright via a Hardware Watermarking Framework

Authors: Kun Wang, Kaiyan Chang, Mengdi Wang, Xinqi Zou, Haobo Xu, Yinhe Han, Ying Wang | Published: 2025-01-05

プロンプトインジェクション

透かしの耐久性

透かし評価

2025.01.05 2025.04.03

文献データベース

A Statistical Hypothesis Testing Framework for Data Misappropriation Detection in Large Language Models

Authors: Yinpeng Cai, Lexin Li, Linjun Zhang | Published: 2025-01-05

フレームワーク

仮説検定

透かし評価

2025.01.05 2025.04.03

文献データベース

FreqMark: Frequency-Based Watermark for Sentence-Level Detection of LLM-Generated Text

Authors: Zhenyu Xu, Kun Zhang, Victor S. Sheng | Published: 2024-10-09

ウォーターマーキング

透かしの耐久性

透かし評価

2024.10.09 2025.04.03

文献データベース

Signal Watermark on Large Language Models

Authors: Zhenyu Xu, Victor S. Sheng | Published: 2024-10-09

LLM性能評価

ウォーターマーキング

透かし評価

2024.10.09 2025.04.03

文献データベース

Watermarking Decision Tree Ensembles

Authors: Stefano Calzavara, Lorenzo Cazzaro, Donald Gera, Salvatore Orlando | Published: 2024-10-06

ウォーターマーキング

サイバーセキュリティ

透かし評価

2024.10.06 2025.04.03

文献データベース