AIセキュリティポータルbot

Verifiable evaluations of machine learning models using zkSNARKs

Authors: Tobin South, Alexander Camuto, Shrey Jain, Shayla Nguyen, Robert Mahari, Christian Paquin, Jason Morton, Alex 'Sandy' Pentland | Published: 2024-02-05 | Updated: 2024-05-22
モデル性能評価
透かし評価
透明性と検証

Estimation of conditional average treatment effects on distributed confidential data

Authors: Yuji Kawamata, Ryoki Motai, Yukihiko Okada, Akira Imakura, Tetsuya Sakurai | Published: 2024-02-05 | Updated: 2024-09-10
ウォーターマーキング
シミュレーション結果評価
データ生成

UniTSyn: A Large-Scale Dataset Capable of Enhancing the Prowess of Large Language Models for Program Testing

Authors: Yifeng He, Jiabo Huang, Yuyang Rong, Yiwen Guo, Ethan Wang, Hao Chen | Published: 2024-02-04
コード生成
データセット生成
テスト優先順位付け

Dynamic Incremental Optimization for Best Subset Selection

Authors: Shaogang Ren, Xiaoning Qian | Published: 2024-02-04 | Updated: 2024-12-30
アルゴリズム
スパースモデル
最適化手法

Jailbreaking Attack against Multimodal Large Language Model

Authors: Zhenxing Niu, Haodong Ren, Xinbo Gao, Gang Hua, Rong Jin | Published: 2024-02-04
プロンプトインジェクション
悪意のあるコンテンツ生成
情報収集手法

A Review and Comparison of AI Enhanced Side Channel Analysis

Authors: Max Panoff, Honggang Yu, Haoqi Shan, Yier Jin | Published: 2024-02-03
ウォーターマーキング
サイバーセキュリティ
深層学習手法

Data Poisoning for In-context Learning

Authors: Pengfei He, Han Xu, Yue Xing, Hui Liu, Makoto Yamada, Jiliang Tang | Published: 2024-02-03 | Updated: 2025-06-02
ポイズニング
ポイズニング攻撃
偽情報の検出

Machine Unlearning in Large Language Models

Authors: Kongyang Chen, Zixin Wang, Bing Mi, Waixi Liu, Shaowei Wang, Xiaojun Ren, Jiaxing Shen | Published: 2024-02-03
プライバシー保護手法
モデル性能評価
倫理的ガイドライン遵守

Human-Centered Privacy Research in the Age of Large Language Models

Authors: Tianshi Li, Sauvik Das, Hao-Ping Lee, Dakuo Wang, Bingsheng Yao, Zhiping Zhang | Published: 2024-02-03
プライバシー保護
プロンプトインジェクション
人間中心のアプローチ

Position Paper: Assessing Robustness, Privacy, and Fairness in Federated Learning Integrated with Foundation Models

Authors: Xi Li, Jiaqi Wang | Published: 2024-02-02
プライバシー保護
公平性評価
連合学習