Uncovering Vulnerabilities of LLM-Assisted Cyber Threat Intelligence Authors: Yuqiao Meng, Luoxi Tang, Feiyang Yu, Jinyuan Jia, Guanhua Yan, Ping Yang, Zhaohan Xi | Published: 2025-09-28 | Updated: 2025-10-01 インダイレクトプロンプトインジェクションバイアス緩和手法脆弱性予測 2025.09.28 文献データベース
Benchmarking LLM-Assisted Blue Teaming via Standardized Threat Hunting Authors: Yuqiao Meng, Luoxi Tang, Feiyang Yu, Xi Li, Guanhua Yan, Ping Yang, Zhaohan Xi | Published: 2025-09-28 | Updated: 2025-10-01 RAGセキュリティ戦略生成学習タスクの効率的な解決 2025.09.28 文献データベース
Measuring Physical-World Privacy Awareness of Large Language Models: An Evaluation Benchmark Authors: Xinjie Shen, Mufei Li, Pan Li | Published: 2025-09-27 | Updated: 2025-10-13 ハルシネーションプライバシー保護技術倫理的選択評価 2025.09.27 文献データベース
MaskSQL: Safeguarding Privacy for LLM-Based Text-to-SQL via Abstraction Authors: Sepideh Abedini, Shubhankar Mohapatra, D. B. Emerson, Masoumeh Shafieinejad, Jesse C. Cresswell, Xi He | Published: 2025-09-27 | Updated: 2025-09-30 SQLクエリ生成プロンプトインジェクションプロンプトリーキング 2025.09.27 文献データベース
LLM Watermark Evasion via Bias Inversion Authors: Jeongyeon Hwang, Sangdon Park, Jungseul Ok | Published: 2025-09-27 | Updated: 2025-10-01 LLMの安全機構の解除モデルインバージョン統計的検定 2025.09.27 文献データベース
Secure and Efficient Access Control for Computer-Use Agents via Context Space Authors: Haochen Gong, Chenxiao Li, Rui Chang, Wenbo Shen | Published: 2025-09-26 | Updated: 2025-10-21 インダイレクトプロンプトインジェクションエージェント設計セキュリティメトリック 2025.09.26 文献データベース
Defending MoE LLMs against Harmful Fine-Tuning via Safety Routing Alignment Authors: Jaehan Kim, Minkyoo Song, Seungwon Shin, Sooel Son | Published: 2025-09-26 | Updated: 2025-10-09 AIによる出力のバイアスの検出ロバスト性防御メカニズム 2025.09.26 文献データベース
Backdoor Attribution: Elucidating and Controlling Backdoor in Language Models Authors: Miao Yu, Zhenhong Zhou, Moayad Aloqaily, Kun Wang, Biwei Huang, Stephen Wang, Yueming Jin, Qingsong Wen | Published: 2025-09-26 | Updated: 2025-09-30 LLMの安全機構の解除自己注意メカニズム解釈可能性 2025.09.26 文献データベース
It’s not Easy: Applying Supervised Machine Learning to Detect Malicious Extensions in the Chrome Web Store Authors: Ben Rosenzweig, Valentino Dalla Valle, Giovanni Apruzzese, Aurore Fass | Published: 2025-09-25 | Updated: 2025-10-02 プログラム解析ユーザー活動解析悪意のあるパッケージ検出 2025.09.25 文献データベース
No Prior, No Leakage: Revisiting Reconstruction Attacks in Trained Neural Networks Authors: Yehonatan Refael, Guy Smorodinsky, Ofir Lindenbaum, Itay Safran | Published: 2025-09-25 トレーニングデータ生成プライバシー保護メカニズムプライバシー保護手法 2025.09.25 文献データベース