学習データの偏り

Do We Really Need Curated Malicious Data for Safety Alignment in Multi-modal Large Language Models?

Authors: Yanbo Wang, Jiyang Guan, Jian Liang, Ran He | Published: 2025-04-14

プロンプトインジェクション

学習データの偏り

安全性アライメント

2025.04.14

文献データベース

DefAn: Definitive Answer Dataset for LLMs Hallucination Evaluation

Authors: A B M Ashikur Rahman, Saeed Anwar, Muhammad Usman, Ajmal Mian | Published: 2024-06-13

ハルシネーション

モデル評価

学習データの偏り

2024.06.13 2025.04.03

文献データベース

The Reversal Curse: LLMs trained on “A is B” fail to learn “B is A”

Authors: Lukas Berglund, Meg Tong, Max Kaufmann, Mikita Balesni, Asa Cooper Stickland, Tomasz Korbak, Owain Evans | Published: 2023-09-21 | Updated: 2024-05-26

ハルシネーション

モデル評価

学習データの偏り

2023.09.21 2025.04.03

文献データベース

Algorithmic Bias in Recidivism Prediction: A Causal Perspective

Authors: Aria Khademi, Vasant Honavar | Published: 2019-11-24

アルゴリズム

学習データのバイアス排除

学習データの偏り

2019.11.24 2025.04.03

文献データベース

No Classification without Representation: Assessing Geodiversity Issues in Open Data Sets for the Developing World

Authors: Shreya Shankar, Yoni Halpern, Eric Breck, James Atwood, Jimbo Wilson, D. Sculley | Published: 2017-11-22

データ生成

学習データのバイアス排除

学習データの偏り

2017.11.22 2025.04.03

文献データベース

Predicting Exploitation of Disclosed Software Vulnerabilities Using Open-source Data

Authors: Benjamin L. Bullough, Anna K. Yanchenko, Christopher L. Smith, Joseph R. Zipkin | Published: 2017-07-25

学習データの偏り

情報セキュリティ

機械学習フレームワーク

2017.07.25 2025.04.03

文献データベース

Optimized Data Pre-Processing for Discrimination Prevention

Authors: Flavio P. Calmon, Dennis Wei, Karthikeyan Natesan Ramamurthy, Kush R. Varshney | Published: 2017-04-11

フェアネス学習

公平性のあるAIモデルの作成

学習データの偏り

2017.04.11 2025.04.03

文献データベース