Do We Really Need Curated Malicious Data for Safety Alignment in Multi-modal Large Language Models? Authors: Yanbo Wang, Jiyang Guan, Jian Liang, Ran He | Published: 2025-04-14 プロンプトインジェクション学習データの偏り安全性アライメント 2025.04.14 文献データベース
DefAn: Definitive Answer Dataset for LLMs Hallucination Evaluation Authors: A B M Ashikur Rahman, Saeed Anwar, Muhammad Usman, Ajmal Mian | Published: 2024-06-13 ハルシネーションモデル評価学習データの偏り 2024.06.13 2025.04.03 文献データベース
The Reversal Curse: LLMs trained on “A is B” fail to learn “B is A” Authors: Lukas Berglund, Meg Tong, Max Kaufmann, Mikita Balesni, Asa Cooper Stickland, Tomasz Korbak, Owain Evans | Published: 2023-09-21 | Updated: 2024-05-26 ハルシネーションモデル評価学習データの偏り 2023.09.21 2025.04.03 文献データベース
Algorithmic Bias in Recidivism Prediction: A Causal Perspective Authors: Aria Khademi, Vasant Honavar | Published: 2019-11-24 アルゴリズム学習データのバイアス排除学習データの偏り 2019.11.24 2025.04.03 文献データベース
No Classification without Representation: Assessing Geodiversity Issues in Open Data Sets for the Developing World Authors: Shreya Shankar, Yoni Halpern, Eric Breck, James Atwood, Jimbo Wilson, D. Sculley | Published: 2017-11-22 データ生成学習データのバイアス排除学習データの偏り 2017.11.22 2025.04.03 文献データベース
Predicting Exploitation of Disclosed Software Vulnerabilities Using Open-source Data Authors: Benjamin L. Bullough, Anna K. Yanchenko, Christopher L. Smith, Joseph R. Zipkin | Published: 2017-07-25 学習データの偏り情報セキュリティ機械学習フレームワーク 2017.07.25 2025.04.03 文献データベース
Optimized Data Pre-Processing for Discrimination Prevention Authors: Flavio P. Calmon, Dennis Wei, Karthikeyan Natesan Ramamurthy, Kush R. Varshney | Published: 2017-04-11 フェアネス学習公平性のあるAIモデルの作成学習データの偏り 2017.04.11 2025.04.03 文献データベース