Attention Tracker: Detecting Prompt Injection Attacks in LLMs Authors: Kuo-Han Hung, Ching-Yun Ko, Ambrish Rawat, I-Hsin Chung, Winston H. Hsu, Pin-Yu Chen | Published: 2024-11-01 | Updated: 2025-04-23 インダイレクトプロンプトインジェクション大規模言語モデル注意メカニズム 2024.11.01 文献データベース
Efficient Model Compression for Bayesian Neural Networks Authors: Diptarka Saha, Zihe Liu, Feng Liang | Published: 2024-11-01 スパースモデルモデル性能評価最適化問題 2024.11.01 2025.04.03 文献データベース
Automated Trustworthiness Oracle Generation for Machine Learning Text Classifiers Authors: Lam Nguyen Tung, Steven Cho, Xiaoning Du, Neelofar Neelofar, Valerio Terragni, Stefano Ruberto, Aldeida Aleti | Published: 2024-10-30 | Updated: 2025-04-08 XAI(説明可能なAI)モデル性能評価信頼性分析 2024.10.30 文献データベース
CausAdv: A Causal-based Framework for Detecting Adversarial Examples Authors: Hichem Debbi | Published: 2024-10-29 フレームワーク敵対的サンプル 2024.10.29 2025.04.03 文献データベース
Privacy-Preserving Dynamic Assortment Selection Authors: Young Hyun Cho, Will Wei Sun | Published: 2024-10-29 プライバシー保護プライバシー保護手法最適化問題 2024.10.29 2025.04.03 文献データベース
Resilience in Knowledge Graph Embeddings Authors: Arnab Sharma, N'Dah Jean Kouagou, Axel-Cyrille Ngonga Ngomo | Published: 2024-10-28 メンバーシップ推論防御手法 2024.10.28 2025.04.03 文献データベース
CTINexus: Automatic Cyber Threat Intelligence Knowledge Graph Construction Using Large Language Models Authors: Yutong Cheng, Osama Bajaber, Saimon Amanuel Tsegai, Dawn Song, Peng Gao | Published: 2024-10-28 | Updated: 2025-04-21 サイバー脅威インテリジェンスプロンプトリーキング透かし技術 2024.10.28 文献データベース
Integrating uncertainty quantification into randomized smoothing based robustness guarantees Authors: Sina Däubener, Kira Maag, David Krueger, Asja Fischer | Published: 2024-10-27 敵対的サンプル等価性評価 2024.10.27 2025.04.03 文献データベース
On the Geometry of Regularization in Adversarial Training: High-Dimensional Asymptotics and Generalization Bounds Authors: Matteo Vilucchio, Nikolaos Tsilivis, Bruno Loureiro, Julia Kempe | Published: 2024-10-21 収束分析敵対的訓練 2024.10.21 2025.04.03 文献データベース
When Machine Unlearning Meets Retrieval-Augmented Generation (RAG): Keep Secret or Forget Knowledge? Authors: Shang Wang, Tianqing Zhu, Dayong Ye, Wanlei Zhou | Published: 2024-10-20 | Updated: 2025-10-13 RAGRAGへのポイズニング攻撃プライバシー保護技術 2024.10.20 文献データベース