GaussMark: A Practical Approach for Structural Watermarking of Language Models Authors: Adam Block, Ayush Sekhari, Alexander Rakhlin | Published: 2025-01-17 ウォーターマーキング仮説検定実験的検証 2025.01.17 2025.04.03 文献データベース
CaFA: Cost-aware, Feasible Attacks With Database Constraints Against Neural Tabular Classifiers Authors: Matan Ben-Tov, Daniel Deutch, Nave Frost, Mahmood Sharif | Published: 2025-01-17 データ整合性制約実験的検証敵対的サンプル 2025.01.17 2025.04.03 文献データベース
Computing Optimization-Based Prompt Injections Against Closed-Weights Models By Misusing a Fine-Tuning API Authors: Andrey Labunets, Nishit V. Pandya, Ashish Hooda, Xiaohan Fu, Earlence Fernandes | Published: 2025-01-16 プロンプトインジェクション攻撃の評価最適化問題 2025.01.16 2025.04.03 文献データベース
A Survey on Responsible LLMs: Inherent Risk, Malicious Use, and Mitigation Strategy Authors: Huandong Wang, Wenjie Fu, Yingzhou Tang, Zhilong Chen, Yuxi Huang, Jinghua Piao, Chen Gao, Fengli Xu, Tao Jiang, Yong Li | Published: 2025-01-16 サーベイ論文プライバシー保護プロンプトインジェクション大規模言語モデル 2025.01.16 2025.04.03 文献データベース
Neural Honeytrace: A Robust Plug-and-Play Watermarking Framework against Model Extraction Attacks Authors: Yixiao Xu, Binxing Fang, Rui Wang, Yinghai Zhou, Shouling Ji, Yuan Liu, Mohan Li, Zhihong Tian | Published: 2025-01-16 | Updated: 2025-01-17 ウォーターマーキングモデル抽出攻撃攻撃の評価 2025.01.16 2025.04.03 文献データベース
Trusted Machine Learning Models Unlock Private Inference for Problems Currently Infeasible with Cryptography Authors: Ilia Shumailov, Daniel Ramage, Sarah Meiklejohn, Peter Kairouz, Florian Hartmann, Borja Balle, Eugene Bagdasarian | Published: 2025-01-15 Trusted Capable Model Environmentsプライバシー保護暗号学 2025.01.15 2025.04.03 文献データベース
Multilingual Email Phishing Attacks Detection using OSINT and Machine Learning Authors: Panharith An, Rana Shafi, Tionge Mughogho, Onyango Allan Onyango | Published: 2025-01-15 フィッシング検出分類モデル 2025.01.15 2025.04.03 文献データベース
Tag&Tab: Pretraining Data Detection in Large Language Models Using Keyword-Based Membership Inference Attack Authors: Sagiv Antebi, Edan Habler, Asaf Shabtai, Yuval Elovici | Published: 2025-01-14 サイバーセキュリティプライバシー保護大規模言語モデル 2025.01.14 2025.04.03 文献データベース
Unveiling Provider Bias in Large Language Models for Code Generation Authors: Xiaoyu Zhang, Juan Zhai, Shiqing Ma, Qingshuang Bao, Weipeng Jiang, Chao Shen, Yang Liu | Published: 2025-01-14 コード生成バイアスプロンプトインジェクション 2025.01.14 2025.04.03 文献データベース
Adaptive Cybersecurity: Dynamically Retrainable Firewalls for Real-Time Network Protection Authors: Sina Ahmadi | Published: 2025-01-14 サイバーセキュリティネットワーク脅威検出動的ファイアウォール 2025.01.14 2025.04.03 文献データベース