Self-adaptive Dataset Construction for Real-World Multimodal Safety Scenarios Authors: Jingen Qu, Lijun Li, Bo Zhang, Yichen Yan, Jing Shao | Published: 2025-09-04 プロンプトインジェクションリスク分析手法安全性評価手法 2025.09.04 文献データベース
An Automated, Scalable Machine Learning Model Inversion Assessment Pipeline Authors: Tyler Shumaker, Jessica Carpenter, David Saranchak, Nathaniel D. Bastian | Published: 2025-09-04 モデルインバージョンモデル抽出攻撃リスク分析手法 2025.09.04 文献データベース
Identifying Likely-Reputable Blockchain Projects on Ethereum Authors: Cyrus Malik, Josef Bajada, Joshua Ellul | Published: 2025-03-14 データ抽出と分析リスク分析手法特徴エンジニアリング 2025.03.14 2025.04.03 文献データベース
Scalable and Ethical Insider Threat Detection through Data Synthesis and Analysis by LLMs Authors: Haywood Gelman, John D. Hastings | Published: 2025-02-10 | Updated: 2025-04-07 LLMの応用リスク分析手法情報セキュリティ 2025.02.10 文献データベース
S-Eval: Towards Automated and Comprehensive Safety Evaluation for Large Language Models Authors: Xiaohan Yuan, Jinfeng Li, Dongxia Wang, Yuefeng Chen, Xiaofeng Mao, Longtao Huang, Jialuo Chen, Hui Xue, Xiaoxia Liu, Wenhai Wang, Kui Ren, Jingyi Wang | Published: 2024-05-23 | Updated: 2025-04-07 リスク分析手法大規模言語モデル安全性アライメント 2024.05.23 文献データベース
Llama Guard: LLM-based Input-Output Safeguard for Human-AI Conversations Authors: Hakan Inan, Kartikeya Upasani, Jianfeng Chi, Rashi Rungta, Krithika Iyer, Yuning Mao, Michael Tontchev, Qing Hu, Brian Fuller, Davide Testuggine, Madian Khabsa | Published: 2023-12-07 アライメントデータ生成手法リスク分析手法 2023.12.07 2025.04.03 文献データベース
Collaborative Drug Discovery: Inference-level Data Protection Perspective Authors: Balazs Pejo, Mina Remeli, Adam Arany, Mathieu Galtier, Gergely Acs | Published: 2022-05-13 | Updated: 2022-06-09 セキュアアグリゲーションプライバシー評価リスク分析手法 2022.05.13 2025.04.03 文献データベース
A Modified Drake Equation for Assessing Adversarial Risk to Machine Learning Models Authors: Josh Kalin, David Noever, Matthew Ciolino | Published: 2021-03-03 | Updated: 2021-07-07 リスク分析手法敵対的テキスト浄化機械学習 2021.03.03 2025.04.03 文献データベース