文献データベース

The Tail Tells All: Estimating Model-Level Membership Inference Vulnerability Without Reference Models

Authors: Euodia Dodd, Nataša Krčo, Igor Shilov, Yves-Alexandre de Montjoye | Published: 2025-10-22

プライバシー保護機械学習

モデルの堅牢性

低コストのメンバシップ推論手法

2025.10.22

文献データベース

Exploring the Effect of DNN Depth on Adversarial Attacks in Network Intrusion Detection Systems

Authors: Mohamed ElShehaby, Ashraf Matrawy | Published: 2025-10-22

ネットワーク脅威検出

モデルの堅牢性

モデルの頑健性保証

2025.10.22

文献データベース

CircuitGuard: Mitigating LLM Memorization in RTL Code Generation Against IP Leakage

Authors: Nowfel Mashnoor, Mohammad Akyash, Hadi Kamali, Kimia Azar | Published: 2025-10-22

プライバシー保護機械学習

プロンプトリーキング

情報漏洩の原因

2025.10.22

文献データベース

Can You Trust What You See? Alpha Channel No-Box Attacks on Video Object Detection

Authors: Ariana Yi, Ce Zhou, Liyang Xiao, Qiben Yan | Published: 2025-10-22

プラットフォームアーキテクチャ

モデルの堅牢性

研究方法論

2025.10.22

文献データベース

Monitoring LLM-based Multi-Agent Systems Against Corruptions via Node Evaluation

Authors: Chengcan Wu, Zhixin Zhang, Mingqian Xu, Zeming Wei, Meng Sun | Published: 2025-10-22

インダイレクトプロンプトインジェクション

エージェント設計

ネットワーク脅威検出

2025.10.22

文献データベース

Defending Against Prompt Injection with DataFilter

Authors: Yizhu Wang, Sizhe Chen, Raghad Alkhudair, Basel Alomair, David Wagner | Published: 2025-10-22

インダイレクトプロンプトインジェクション

プロンプトインジェクション

プロンプトインジェクション攻撃

2025.10.22

文献データベース

OpenGuardrails: An Open-Source Context-Aware AI Guardrails Platform

Authors: Thomas Wang, Haowen Li | Published: 2025-10-22

プラットフォームアーキテクチャ

動的ポリシー適応

著者貢献

2025.10.22

文献データベース

HarmNet: A Framework for Adaptive Multi-Turn Jailbreak Attacks on Large Language Models

Authors: Sidhant Narula, Javad Rafiei Asl, Mohammad Ghasemigol, Eduardo Blanco, Daniel Takabi | Published: 2025-10-21

クエリ生成手法

大規模言語モデル

脱獄手法

2025.10.21

文献データベース

Exploring Membership Inference Vulnerabilities in Clinical Large Language Models

Authors: Alexander Nemecek, Zebin Yun, Zahra Rahmani, Yaniv Harel, Vipin Chaudhary, Mahmood Sharif, Erman Ayday | Published: 2025-10-21

プライバシー保護機械学習

プロンプトリーキング

医療AIの脅威

2025.10.21

文献データベース

DRsam: Detection of Fault-Based Microarchitectural Side-Channel Attacks in RISC-V Using Statistical Preprocessing and Association Rule Mining

Authors: Muhammad Hassan, Maria Mushtaq, Jaan Raik, Tara Ghasempouri | Published: 2025-10-21

プログラム解析

特徴抽出

異常検出手法

2025.10.21

文献データベース