バイアス | AIセキュリティポータル

Evaluating and Mitigating LLM-as-a-judge Bias in Communication Systems

Authors: Jiaxin Gao, Chen Chen, Yanwen Jia, Xueluan Gong, Kwok-Yan Lam, Qian Wang | Published: 2025-10-14

バイアス

プロンプトリーキング

大規模言語モデル

2025.10.14

文献データベース

Fairness-Constrained Optimization Attack in Federated Learning

Authors: Harsh Kasyap, Minghong Fang, Zhuqing Liu, Carsten Maple, Somanath Tripathy | Published: 2025-10-14

トリガーの検知

バイアス

連合学習

2025.10.14

文献データベース

Taming Data Challenges in ML-based Security Tasks: Lessons from Integrating Generative AI

Authors: Shravya Kanchi, Neal Mangaokar, Aravind Cheruvu, Sifat Muhammad Abdullah, Shirin Nilizadeh, Atul Prakash, Bimal Viswanath | Published: 2025-07-08

データ拡張手法

バイアス

モデル抽出攻撃

2025.07.08

文献データベース

PBa-LLM: Privacy- and Bias-aware NLP using Named-Entity Recognition (NER)

Authors: Gonzalo Mancera, Aythami Morales, Julian Fierrez, Ruben Tolosana, Alejandro Penna, Miguel Lopez-Duran, Francisco Jurado, Alvaro Ortigosa | Published: 2025-06-30 | Updated: 2025-07-09

バイアス

パフォーマンス評価

プライバシーリスク管理

2025.06.30

文献データベース

Breaking Out from the TESSERACT: Reassessing ML-based Malware Detection under Spatio-Temporal Drift

Authors: Theo Chow, Mario D'Onghia, Lorenz Linhardt, Zeliang Kan, Daniel Arp, Lorenzo Cavallaro, Fabio Pierazzi | Published: 2025-06-30

バイアス

マルウェア分類のためのデータセット

評価メトリクス

2025.06.30

文献データベース

Trustworthy AI: Safety, Bias, and Privacy — A Survey

Authors: Xingli Fang, Jianwei Li, Varun Mulchandani, Jung-Eun Kim | Published: 2025-02-11 | Updated: 2025-06-11

バイアス

プロンプトリーキング

差分プライバシー

2025.02.11

文献データベース

Unveiling Provider Bias in Large Language Models for Code Generation

Authors: Xiaoyu Zhang, Juan Zhai, Shiqing Ma, Qingshuang Bao, Weipeng Jiang, Chao Shen, Yang Liu | Published: 2025-01-14

コード生成

バイアス

プロンプトインジェクション

2025.01.14 2025.04.03

文献データベース

Fundamental Limits in the Search for Less Discriminatory Algorithms — and How to Avoid Them

Authors: Benjamin Laufer, Manisch Raghavan, Solon Barocas | Published: 2024-12-24

バイアス

差別的でないアルゴリズムの限界

2024.12.24 2025.04.03

文献データベース

SoK: Towards Security and Safety of Edge AI

Authors: Tatjana Wingarz, Anne Lauscher, Janick Edinger, Dominik Kaaser, Stefan Schulte, Mathias Fischer | Published: 2024-10-07

バイアス

プライバシー保護

防御手法

2024.10.07 2025.04.03

文献データベース

Fooling SHAP with Output Shuffling Attacks

Authors: Jun Yuan, Aritra Dasgupta | Published: 2024-08-12

AIコンプライアンス

ウォーターマーキング

バイアス

2024.08.12 2025.04.03

文献データベース