UpSafe$^\circ$C: Upcycling for Controllable Safety in Large Language Models Authors: Yuhao Sun, Zhuoer Xu, Shiwen Cui, Kun Yang, Lingyun Yu, Yongdong Zhang, Hongtao Xie | Published: 2025-10-02 AIシステムの関係性学習の改善防御手法の統合 2025.10.02 文献データベース
Enabling Regulatory Multi-Agent Collaboration: Architecture, Challenges, and Solutions Authors: Qinnan Hu, Yuntao Wang, Yuan Gao, Zhou Su, Linkang Du | Published: 2025-09-11 AIシステムの関係性倫理基準遵守異常検知手法 2025.09.11 文献データベース
LLMs in the SOC: An Empirical Study of Human-AI Collaboration in Security Operations Centres Authors: Ronal Singh, Shahroz Tariq, Fatemeh Jalalvand, Mohan Baruwal Chhetri, Surya Nepal, Cecile Paris, Martin Lochner | Published: 2025-08-26 AIシステムの関係性テーマ分析専門家の意見収集 2025.08.26 文献データベース
Tab-MIA: A Benchmark Dataset for Membership Inference Attacks on Tabular Data in LLMs Authors: Eyal German, Sagiv Antebi, Daniel Samira, Asaf Shabtai, Yuval Elovici | Published: 2025-07-23 AIシステムの関係性プロパティ推論攻撃プロンプトインジェクション 2025.07.23 文献データベース
eX-NIDS: A Framework for Explainable Network Intrusion Detection Leveraging Large Language Models Authors: Paul R. B. Houssel, Siamak Layeghy, Priyanka Singh, Marius Portmann | Published: 2025-07-22 AIシステムの関係性ネットワークトラフィック分析説明可能性評価 2025.07.22 文献データベース
CTI4AI: Threat Intelligence Generation and Sharing after Red Teaming AI Models Authors: Chuyen Nguyen, Caleb Morgan, Sudip Mittal | Published: 2022-08-16 AIシステムの関係性攻撃検出脆弱性検出 2022.08.16 2025.04.03 文献データベース