Adaptive Evaluation of Out-of-Band Defenses Against Prompt Injection in LLM Agents Authors: Praneeth Narisetty, Shiva Nagendra Babu Kore, Uday Kumar Reddy Kattamanchi, Jayaram Kumarapu | Published: 2026-06-25 インダイレクトプロンプトインジェクションエージェント操作手法透かし攻撃 2026.06.25 文献データベース
Detect, Unlearn, Restore: Defending Text Summarization Models Against Data Poisoning Authors: Poojitha Thota, Shirin Nilizadeh | Published: 2026-06-24 データセットの影響データ毒性攻撃ポイズニング 2026.06.24 文献データベース
Privacy Vulnerabilities of Attention Layers in Tabular Foundation Models and Protection of High-Risk Queries Authors: Tânia Carvalho, Maxime Cordy | Published: 2026-06-24 データプライバシー評価メンバーシップ推論差分プライバシー 2026.06.24 文献データベース
Color Matters: Trigger Color Affects Success in Federated Backdoor Attacks Authors: Kavindu Herath, Joshua C. Zhao, Saurabh Bagchi | Published: 2026-06-24 バックドア攻撃手法色パレットの影響透かし設計 2026.06.24 文献データベース
Can Machine Learning Break Wi-Fi Privacy? A Study on MAC Address Randomization Authors: Marta Puig, Costas Michaelides, Lucia Pintor, Boris Bellalta, Francesc Wilhelmi | Published: 2026-06-24 データセットの影響パフォーマンス評価特徴エンジニアリング 2026.06.24 文献データベース
Do Encoders Suffice? A Systematic Comparison of Encoder and Decoder Safety Judges for LLM Adversarial Evaluation Authors: Han Jeon, Shiv Medler, Joseph Voyles, Matt Wood | Published: 2026-06-24 データセットの影響データ生成手法プロンプトインジェクション 2026.06.24 文献データベース
RAS: Measuring LLM Safety Through Refusal Alignment Authors: Chang-Chieh Huang, Yan-Lun Chen, Chia-Mu Yu, Wei-Bin Lee | Published: 2026-06-24 プロンプトインジェクション出力の有害度の算出大規模言語モデル 2026.06.24 文献データベース
Taxonomy of Risks on Automated Fact-Checking Systems Considering its Propagation Authors: Jun Yajima, Tatsuya Oka, Takao Okubo | Published: 2026-06-24 リスク評価手法社会的影響自動化ファクトチェック 2026.06.24 文献データベース
An Approach for a Supporting Multi-LLM System for Automated Certification Based on the German IT-Grundschutz Authors: Lea Roxanne Muth, Marian Margraf | Published: 2026-06-24 RAGRAGへのポイズニング攻撃リソース不足の課題 2026.06.24 文献データベース
CrypFormBench: Benchmarking Formal Analysis Capability of Large Language Models for Cryptographic Schemes Authors: Zhaoxuan Li, Qionglu Zhang, Hengyuan Liu, Xiaoyan Gu, Xianhui Lu, Hongbo Liu, Bingzheng Wang, Haihui Fan, Ziming Zhao, Rui Zhang, Li Zhou | Published: 2026-06-24 パフォーマンス評価プロンプトリーキング透かし評価 2026.06.24 文献データベース