AIセキュリティポータルbot | ページ 193 | AIセキュリティポータル

Collaborative Heterogeneous Causal Inference Beyond Meta-analysis

Authors: Tianyu Guo, Sai Praneeth Karimireddy, Michael I. Jordan | Published: 2024-04-24

アルゴリズム

ウォーターマーキング

バイアス

2024.04.24 2025.04.03

文献データベース

MISLEAD: Manipulating Importance of Selected features for Learning Epsilon in Evasion Attack Deception

Authors: Vidit Khazanchi, Pavan Kulkarni, Yuvaraj Govindarajulu, Manojkumar Parmar | Published: 2024-04-24 | Updated: 2024-05-02

モデルの解釈性

攻撃手法

敵対的訓練

2024.04.24 2025.04.03

文献データベース

Watch Out for Your Guidance on Generation! Exploring Conditional Backdoor Attacks against Large Language Models

Authors: Jiaming He, Wenbo Jiang, Guanyu Hou, Wenshu Fan, Rui Zhang, Hongwei Li | Published: 2024-04-23 | Updated: 2025-01-08

LLMセキュリティ

バックドア攻撃

ポイズニング

2024.04.23 2025.04.03

文献データベース

A Customer Level Fraudulent Activity Detection Benchmark for Enhancing Machine Learning Model Research and Evaluation

Authors: Phoebe Jing, Yijing Gao, Xianlong Zeng | Published: 2024-04-23

ウォーターマーキング

データプライバシー評価

機械学習手法

2024.04.23 2025.04.03

文献データベース

Chain of trust: Unraveling references among Common Criteria certified products

Authors: Adam Janovsky, Łukasz Chmielewski, Petr Svenda, Jan Jancar, Vashek Matyas | Published: 2024-04-22 | Updated: 2024-08-19

依存関係リスク評価

評価手法

透かし評価

2024.04.22 2025.04.03

文献データベース

Protecting Your LLMs with Information Bottleneck

Authors: Zichuan Liu, Zefan Wang, Linjie Xu, Jinyu Wang, Lei Song, Tianchun Wang, Chunlin Chen, Wei Cheng, Jiang Bian | Published: 2024-04-22 | Updated: 2024-10-10

LLMセキュリティ

プロンプトインジェクション

倫理的ガイドライン遵守

2024.04.22 2025.04.03

文献データベース

Competition Report: Finding Universal Jailbreak Backdoors in Aligned LLMs

Authors: Javier Rando, Francesco Croce, Kryštof Mitka, Stepan Shabalin, Maksym Andriushchenko, Nicolas Flammarion, Florian Tramèr | Published: 2024-04-22 | Updated: 2024-06-06

LLMセキュリティ

バックドア攻撃

プロンプトインジェクション

2024.04.22 2025.04.03

文献データベース

AdvPrompter: Fast Adaptive Adversarial Prompting for LLMs

Authors: Anselm Paulus, Arman Zharmagambetov, Chuan Guo, Brandon Amos, Yuandong Tian | Published: 2024-04-21

LLMセキュリティ

プロンプトインジェクション

プロンプトエンジニアリング

2024.04.21 2025.04.03

文献データベース

Reliable Model Watermarking: Defending Against Theft without Compromising on Evasion

Authors: Hongyu Zhu, Sichu Liang, Wentao Hu, Fangqi Li, Ju Jia, Shilin Wang | Published: 2024-04-21

メンバーシップ推論

透かしの耐久性

透かし評価

2024.04.21 2025.04.03

文献データベース

PristiQ: A Co-Design Framework for Preserving Data Security of Quantum Learning in the Cloud

Authors: Zhepeng Wang, Yi Sheng, Nirajan Koirala, Kanad Basu, Taeho Jung, Cheng-Chang Lu, Weiwen Jiang | Published: 2024-04-20

ウォーターマーキング

量子フレームワーク

量子暗号技術

2024.04.20 2025.04.03

文献データベース