文献データベース

SPATA: Systematic Pattern Analysis for Detailed and Transparent Data Cards

Authors: João Vitorino, Eva Maia, Isabel Praça, Carlos Soares | Published: 2025-09-30

プライバシー保護機械学習

敵対的学習

解釈可能性

2025.09.30

文献データベース

Explainable and Resilient ML-Based Physical-Layer Attack Detectors

Authors: Aleksandra Knapińska, Marija Furdek | Published: 2025-09-30

モデルインバージョン

モデル性能評価

物理層攻撃検出

2025.09.30

文献データベース

SeedPrints: Fingerprints Can Even Tell Which Seed Your Large Language Model Was Trained From

Authors: Yao Tong, Haonan Wang, Siquan Li, Kenji Kawaguchi, Tianyang Hu | Published: 2025-09-30

トークン分布分析

ハルシネーション

モデル性能評価

2025.09.30

文献データベース

Better Privilege Separation for Agents by Restricting Data Types

Authors: Dennis Jacob, Emad Alghamdi, Zhanhao Hu, Basel Alomair, David Wagner | Published: 2025-09-30

インダイレクトプロンプトインジェクション

セキュリティ戦略生成

悪意のあるプロンプト

2025.09.30

文献データベース

Fingerprinting LLMs via Prompt Injection

Authors: Yuepeng Hu, Zhengyuan Jiang, Mengyuan Li, Osama Ahmed, Zhicong Huang, Cheng Hong, Neil Gong | Published: 2025-09-29 | Updated: 2025-10-01

インダイレクトプロンプトインジェクション

トークン識別手法

プロンプトインジェクション

2025.09.29

文献データベース

Uncovering Vulnerabilities of LLM-Assisted Cyber Threat Intelligence

Authors: Yuqiao Meng, Luoxi Tang, Feiyang Yu, Jinyuan Jia, Guanhua Yan, Ping Yang, Zhaohan Xi | Published: 2025-09-28 | Updated: 2025-10-01

インダイレクトプロンプトインジェクション

バイアス緩和手法

脆弱性予測

2025.09.28

文献データベース

Benchmarking LLM-Assisted Blue Teaming via Standardized Threat Hunting

Authors: Yuqiao Meng, Luoxi Tang, Feiyang Yu, Xi Li, Guanhua Yan, Ping Yang, Zhaohan Xi | Published: 2025-09-28 | Updated: 2025-10-01

RAG

セキュリティ戦略生成

学習タスクの効率的な解決

2025.09.28

文献データベース

Measuring Physical-World Privacy Awareness of Large Language Models: An Evaluation Benchmark

Authors: Xinjie Shen, Mufei Li, Pan Li | Published: 2025-09-27 | Updated: 2025-10-13

ハルシネーション

プライバシー保護技術

倫理的選択評価

2025.09.27

文献データベース

MaskSQL: Safeguarding Privacy for LLM-Based Text-to-SQL via Abstraction

Authors: Sepideh Abedini, Shubhankar Mohapatra, D. B. Emerson, Masoumeh Shafieinejad, Jesse C. Cresswell, Xi He | Published: 2025-09-27 | Updated: 2025-09-30

SQLクエリ生成

プロンプトインジェクション

プロンプトリーキング

2025.09.27

文献データベース

LLM Watermark Evasion via Bias Inversion

Authors: Jeongyeon Hwang, Sangdon Park, Jungseul Ok | Published: 2025-09-27 | Updated: 2025-10-01

LLMの安全機構の解除

モデルインバージョン

統計的検定

2025.09.27

文献データベース