Synthesizing Access Control Policies using Large Language Models Authors: Adarsh Vatsa, Pratyush Patel, William Eiers | Published: 2025-03-14 AIによる出力のバイアスの検出データ生成手法プライバシー設計原則 2025.03.14 2025.04.03 文献データベース
Measuring Implicit Bias in Explicitly Unbiased Large Language Models Authors: Xuechunzi Bai, Angelina Wang, Ilia Sucholutsky, Thomas L. Griffiths | Published: 2024-02-06 | Updated: 2024-05-23 AIによる出力のバイアスの検出アルゴリズムの公平性大規模言語モデル 2024.02.06 2025.04.03 文献データベース
Gender bias and stereotypes in Large Language Models Authors: Hadas Kotek, Rikker Dockum, David Q. Sun | Published: 2023-08-28 AIによる出力のバイアスの検出アルゴリズムの公平性大規模言語モデル 2023.08.28 2025.04.03 文献データベース
ADEPT: A DEbiasing PrompT Framework Authors: Ke Yang, Charles Yu, Yi Fung, Manling Li, Heng Ji | Published: 2022-11-10 | Updated: 2022-12-23 AIによる出力のバイアスの検出プロンプティング戦略公平性のあるAIモデルの作成 2022.11.10 2025.04.03 文献データベース
Few-shot Instruction Prompts for Pretrained Language Models to Detect Social Biases Authors: Shrimai Prabhumoye, Rafal Kocielnik, Mohammad Shoeybi, Anima Anandkumar, Bryan Catanzaro | Published: 2021-12-15 | Updated: 2022-04-15 AIによる出力のバイアスの検出Few-Shot Learning大規模言語モデル 2021.12.15 2025.04.03 文献データベース
Debiasing Pre-trained Contextualised Embeddings Authors: Masahiro Kaneko, Danushka Bollegala | Published: 2021-01-23 AIによる出力のバイアスの検出公平性のあるAIモデルの作成深層学習手法 2021.01.23 2025.04.03 文献データベース
Towards Debiasing Sentence Representations Authors: Paul Pu Liang, Irene Mengze Li, Emily Zheng, Yao Chong Lim, Ruslan Salakhutdinov, Louis-Philippe Morency | Published: 2020-07-16 AIによる出力のバイアスの検出アルゴリズムの公平性公平性のあるAIモデルの作成 2020.07.16 2025.04.03 文献データベース
Measuring Bias in Contextualized Word Representations Authors: Keita Kurita, Nidhi Vyas, Ayush Pareek, Alan W Black, Yulia Tsvetkov | Published: 2019-06-18 AIによる出力のバイアスの検出アルゴリズムの公平性大規模言語モデル 2019.06.18 2025.04.03 文献データベース