学習データの偏り

Do We Really Need Curated Malicious Data for Safety Alignment in Multi-modal Large Language Models?

Authors: Yanbo Wang, Jiyang Guan, Jian Liang, Ran He | Published: 2025-04-14
プロンプトインジェクション
学習データの偏り
安全性アライメント

DefAn: Definitive Answer Dataset for LLMs Hallucination Evaluation

Authors: A B M Ashikur Rahman, Saeed Anwar, Muhammad Usman, Ajmal Mian | Published: 2024-06-13
ハルシネーション
モデル評価
学習データの偏り

The Reversal Curse: LLMs trained on “A is B” fail to learn “B is A”

Authors: Lukas Berglund, Meg Tong, Max Kaufmann, Mikita Balesni, Asa Cooper Stickland, Tomasz Korbak, Owain Evans | Published: 2023-09-21 | Updated: 2024-05-26
ハルシネーション
モデル評価
学習データの偏り

Algorithmic Bias in Recidivism Prediction: A Causal Perspective

Authors: Aria Khademi, Vasant Honavar | Published: 2019-11-24
アルゴリズム
学習データのバイアス排除
学習データの偏り

No Classification without Representation: Assessing Geodiversity Issues in Open Data Sets for the Developing World

Authors: Shreya Shankar, Yoni Halpern, Eric Breck, James Atwood, Jimbo Wilson, D. Sculley | Published: 2017-11-22
データ生成
学習データのバイアス排除
学習データの偏り

Predicting Exploitation of Disclosed Software Vulnerabilities Using Open-source Data

Authors: Benjamin L. Bullough, Anna K. Yanchenko, Christopher L. Smith, Joseph R. Zipkin | Published: 2017-07-25
学習データの偏り
情報セキュリティ
機械学習フレームワーク

Optimized Data Pre-Processing for Discrimination Prevention

Authors: Flavio P. Calmon, Dennis Wei, Karthikeyan Natesan Ramamurthy, Kush R. Varshney | Published: 2017-04-11
フェアネス学習
公平性のあるAIモデルの作成
学習データの偏り