バイアス

Can Implicit Bias Imply Adversarial Robustness?

Authors: Hancheng Min, René Vidal | Published: 2024-05-24 | Updated: 2024-06-05
アルゴリズム
バイアス
敵対的訓練

A Systematic and Formal Study of the Impact of Local Differential Privacy on Fairness: Preliminary Results

Authors: Karima Makhlouf, Tamara Stefanovic, Heber H. Arcolezi, Catuscia Palamidessi | Published: 2024-05-23
バイアス
プライバシー保護
プライバシー保護手法

Trustworthy AI-Generative Content in Intelligent 6G Network: Adversarial, Privacy, and Fairness

Authors: Siyuan Li, Xi Lin, Yaju Liu, Jianhua Li | Published: 2024-05-09
バイアス
プライバシー保護
プロンプトインジェクション

Evaluating and Mitigating Linguistic Discrimination in Large Language Models

Authors: Guoliang Dong, Haoyu Wang, Jun Sun, Xinyu Wang | Published: 2024-04-29 | Updated: 2024-05-10
LLM性能評価
バイアス
プロンプトインジェクション

Collaborative Heterogeneous Causal Inference Beyond Meta-analysis

Authors: Tianyu Guo, Sai Praneeth Karimireddy, Michael I. Jordan | Published: 2024-04-24
アルゴリズム
ウォーターマーキング
バイアス

Can Biases in ImageNet Models Explain Generalization?

Authors: Paul Gavrikov, Janis Keuper | Published: 2024-04-01
バイアス
モデル性能評価
透かし評価

De-amplifying Bias from Differential Privacy in Language Model Fine-tuning

Authors: Sanjari Srivastava, Piotr Mardziel, Zhikhun Zhang, Archana Ahlawat, Anupam Datta, John C Mitchell | Published: 2024-02-07
データプライバシー評価
バイアス
プライバシー保護

TESSERACT: Eliminating Experimental Bias in Malware Classification across Space and Time (Extended Version)

Authors: Zeliang Kan, Shae McFadden, Daniel Arp, Feargus Pendlebury, Roberto Jordaney, Johannes Kinder, Fabio Pierazzi, Lorenzo Cavallaro | Published: 2024-02-02
バイアス
マルウェア分類
時間に関連する特徴

Domain-Independent Deception: A New Taxonomy and Linguistic Analysis

Authors: Rakesh M. Verma, Nachum Dershowitz, Victor Zeng, Dainis Boumber, Xuting Liu | Published: 2024-02-01
ウォーターマーキング
ドメイン非依存性
バイアス

Comparing Spectral Bias and Robustness For Two-Layer Neural Networks: SGD vs Adaptive Random Fourier Features

Authors: Aku Kammonen, Lisi Liang, Anamika Pandey, Raúl Tempone | Published: 2024-02-01
ウォーターマーキング
バイアス
敵対的攻撃検出