Bias | Page 2 | AI Security Portal

Can Implicit Bias Imply Adversarial Robustness?

Authors: Hancheng Min, René Vidal | Published: 2024-05-24 | Updated: 2024-06-05

Algorithm

Bias

Adversarial Training

2024.05.24 2025.05.27

Literature Database

A Systematic and Formal Study of the Impact of Local Differential Privacy on Fairness: Preliminary Results

Authors: Karima Makhlouf, Tamara Stefanovic, Heber H. Arcolezi, Catuscia Palamidessi | Published: 2024-05-23

Bias

Privacy Protection

Privacy Protection Method

2024.05.23 2025.05.27

Literature Database

Trustworthy AI-Generative Content in Intelligent 6G Network: Adversarial, Privacy, and Fairness

Authors: Siyuan Li, Xi Lin, Yaju Liu, Jianhua Li | Published: 2024-05-09

Bias

Privacy Protection

Prompt Injection

2024.05.09 2025.05.27

Literature Database

Evaluating and Mitigating Linguistic Discrimination in Large Language Models

Authors: Guoliang Dong, Haoyu Wang, Jun Sun, Xinyu Wang | Published: 2024-04-29 | Updated: 2024-05-10

LLM Performance Evaluation

Bias

Prompt Injection

2024.04.29 2025.05.27

Literature Database

Collaborative Heterogeneous Causal Inference Beyond Meta-analysis

Authors: Tianyu Guo, Sai Praneeth Karimireddy, Michael I. Jordan | Published: 2024-04-24

Algorithm

Watermarking

Bias

2024.04.24 2025.05.27

Literature Database

Can Biases in ImageNet Models Explain Generalization?

Authors: Paul Gavrikov, Janis Keuper | Published: 2024-04-01

Bias

Model Performance Evaluation

Watermark Evaluation

2024.04.01 2025.05.27

Literature Database

De-amplifying Bias from Differential Privacy in Language Model Fine-tuning

Authors: Sanjari Srivastava, Piotr Mardziel, Zhikhun Zhang, Archana Ahlawat, Anupam Datta, John C Mitchell | Published: 2024-02-07

Data Privacy Assessment

Bias

Privacy Protection

2024.02.07 2025.05.27

Literature Database

TESSERACT: Eliminating Experimental Bias in Malware Classification across Space and Time (Extended Version)

Authors: Zeliang Kan, Shae McFadden, Daniel Arp, Feargus Pendlebury, Roberto Jordaney, Johannes Kinder, Fabio Pierazzi, Lorenzo Cavallaro | Published: 2024-02-02 | Updated: 2025-04-09

Bias

Malware Classification

Time-Related Features

2024.02.02 2025.05.27

Literature Database

Domain-Independent Deception: A New Taxonomy and Linguistic Analysis

Authors: Rakesh M. Verma, Nachum Dershowitz, Victor Zeng, Dainis Boumber, Xuting Liu | Published: 2024-02-01

Watermarking

Domain Independence

Bias

2024.02.01 2025.05.27

Literature Database

Comparing Spectral Bias and Robustness For Two-Layer Neural Networks: SGD vs Adaptive Random Fourier Features

Authors: Aku Kammonen, Lisi Liang, Anamika Pandey, Raúl Tempone | Published: 2024-02-01

Watermarking

Bias

Adversarial Attack Detection

2024.02.01 2025.05.27

Literature Database