CyberGym: Evaluating AI Agents’ Cybersecurity Capabilities with Real-World Vulnerabilities at Scale Authors: Zhun Wang, Tianneng Shi, Jingxuan He, Matthew Cai, Jialin Zhang, Dawn Song | Published: 2025-06-03 プロンプトインジェクション動的分析手法透かし評価 2025.06.03 文献データベース
UniNet: A Unified Multi-granular Traffic Modeling Framework for Network Security Authors: Binghui Wu, Dinil Mon Divakaran, Mohan Gurusamy | Published: 2025-03-06 | Updated: 2025-07-03 IoTトラフィック分析ネットワークトラフィックの変更透かし評価 2025.03.06 文献データベース
Protecting Users From Themselves: Safeguarding Contextual Privacy in Interactions with Conversational Agents Authors: Ivoline Ngong, Swanand Kadhe, Hao Wang, Keerthiram Murugesan, Justin D. Weisz, Amit Dhurandhar, Karthikeyan Natesan Ramamurthy | Published: 2025-02-22 | Updated: 2025-07-28 プライバシーリスク管理プロンプトリーキング透かし評価 2025.02.22 文献データベース
RAG-WM: An Efficient Black-Box Watermarking Approach for Retrieval-Augmented Generation of Large Language Models Authors: Peizhuo Lv, Mengjie Sun, Hao Wang, Xiaofeng Wang, Shengzhi Zhang, Yuxuan Chen, Kai Chen, Limin Sun | Published: 2025-01-09 RAGウォーターマーキング透かし評価 2025.01.09 2025.04.03 文献データベース
RTLMarker: Protecting LLM-Generated RTL Copyright via a Hardware Watermarking Framework Authors: Kun Wang, Kaiyan Chang, Mengdi Wang, Xinqi Zou, Haobo Xu, Yinhe Han, Ying Wang | Published: 2025-01-05 プロンプトインジェクション透かしの耐久性透かし評価 2025.01.05 2025.04.03 文献データベース
A Statistical Hypothesis Testing Framework for Data Misappropriation Detection in Large Language Models Authors: Yinpeng Cai, Lexin Li, Linjun Zhang | Published: 2025-01-05 フレームワーク仮説検定透かし評価 2025.01.05 2025.04.03 文献データベース
Combining Machine Learning Defenses without Conflicts Authors: Vasisht Duddu, Rui Zhang, N. Asokan | Published: 2024-11-14 | Updated: 2025-08-14 モデルの頑健性保証透かし評価防御手法の統合 2024.11.14 文献データベース
Private Counterfactual Retrieval Authors: Mohamed Nomeir, Pasan Dissanayake, Shreya Meel, Sanghamitra Dutta, Sennur Ulukus | Published: 2024-10-17 | Updated: 2025-07-24 プライバシー保護手法距離評価手法透かし評価 2024.10.17 文献データベース
FreqMark: Frequency-Based Watermark for Sentence-Level Detection of LLM-Generated Text Authors: Zhenyu Xu, Kun Zhang, Victor S. Sheng | Published: 2024-10-09 ウォーターマーキング透かしの耐久性透かし評価 2024.10.09 2025.04.03 文献データベース
Signal Watermark on Large Language Models Authors: Zhenyu Xu, Victor S. Sheng | Published: 2024-10-09 LLM性能評価ウォーターマーキング透かし評価 2024.10.09 2025.04.03 文献データベース