LLM Safety Alignment is Divergence Estimation in Disguise Authors: Rajdeep Haldar, Ziyi Wang, Qifan Song, Guang Lin, Yue Xing | Published: 2025-02-02 プロンプトインジェクション収束分析大規模言語モデル安全性アライメント 2025.02.02 2025.04.03 文献データベース
Byzantine-Resilient Zero-Order Optimization for Communication-Efficient Heterogeneous Federated Learning Authors: Maximilian Egger, Mayank Bakshi, Rawad Bitar | Published: 2025-01-31 収束保証収束分析通信効率 2025.01.31 2025.04.03 文献データベース
BounTCHA: A CAPTCHA Utilizing Boundary Identification in Guided Generative AI-extended Videos Authors: Lehao Lin, Ke Wang, Maha Abdallah, Wei Cai | Published: 2025-01-30 | Updated: 2025-04-01 CAPTCHA動画信頼性確保敵対的サンプルの脆弱性 2025.01.30 2025.04.03 文献データベース
Smoothed Embeddings for Robust Language Models Authors: Ryo Hase, Md Rafi Ur Rashid, Ashley Lewis, Jing Liu, Toshiaki Koike-Akino, Kieran Parsons, Ye Wang | Published: 2025-01-27 プロンプトインジェクションメンバーシップ推論敵対的訓練 2025.01.27 2025.04.03 文献データベース
Improving Network Threat Detection by Knowledge Graph, Large Language Model, and Imbalanced Learning Authors: Lili Zhang, Quanyan Zhu, Herman Ray, Ying Xie | Published: 2025-01-26 ネットワーク脅威検出ユーザー活動解析学習の改善 2025.01.26 2025.04.03 文献データベース
A Selective Homomorphic Encryption Approach for Faster Privacy-Preserving Federated Learning Authors: Abdulkadir Korkmaz, Praveen Rao | Published: 2025-01-22 | Updated: 2025-03-27 プライバシー問題透かし技術連合学習 2025.01.22 2025.04.03 文献データベース
Heterogeneous Multi-Player Multi-Armed Bandits Robust To Adversarial Attacks Authors: Akshayaa Magesh, Venugopal V. Veeravalli | Published: 2025-01-21 収束保証収束分析通信効率 2025.01.21 2025.04.03 文献データベース
Provably effective detection of effective data poisoning attacks Authors: Jonathan Gallagher, Yasaman Esfandiari, Callen MacPhee, Michael Warren | Published: 2025-01-21 バックドア攻撃ポイズニング実験的検証 2025.01.21 2025.04.03 文献データベース
Poison-RAG: Adversarial Data Poisoning Attacks on Retrieval-Augmented Generation in Recommender Systems Authors: Fatemeh Nazary, Yashar Deldjoo, Tommaso di Noia | Published: 2025-01-20 RAGへのポイズニング攻撃タグ選択戦略ポイズニング攻撃 2025.01.20 2025.04.03 文献データベース
Everyone’s Privacy Matters! An Analysis of Privacy Leakage from Real-World Facial Images on Twitter and Associated User Behaviors Authors: Yuqi Niu, Weidong Qiu, Peng Tang, Lifan Wang, Shuo Chen, Shujun Li, Nadin Kokciyan, Ben Niu | Published: 2025-01-20 プライバシー手法画像をAIにより分析し、個人情報を推測する攻撃顔認識技術 2025.01.20 2025.04.03 文献データベース