モデル評価

Why Are My Prompts Leaked? Unraveling Prompt Extraction Threats in Customized Large Language Models

Authors: Zi Liang, Haibo Hu, Qingqing Ye, Yaxin Xiao, Haoyang Li | Published: 2024-08-05 | Updated: 2025-02-12
プロンプトインジェクション
プロンプトリーキング
モデル評価

DefAn: Definitive Answer Dataset for LLMs Hallucination Evaluation

Authors: A B M Ashikur Rahman, Saeed Anwar, Muhammad Usman, Ajmal Mian | Published: 2024-06-13
ハルシネーション
モデル評価
学習データの偏り

Inducing High Energy-Latency of Large Vision-Language Models with Verbose Images

Authors: Kuofeng Gao, Yang Bai, Jindong Gu, Shu-Tao Xia, Philip Torr, Zhifeng Li, Wei Liu | Published: 2024-01-20 | Updated: 2024-03-22
モデルDoS
モデル評価
リソース不足の課題

Language Model Inversion

Authors: John X. Morris, Wenting Zhao, Justin T. Chiu, Vitaly Shmatikov, Alexander M. Rush | Published: 2023-11-22
プロンプトリーキング
モデルインバージョン
モデル評価

Text Embeddings Reveal (Almost) As Much As Text

Authors: John X. Morris, Volodymyr Kuleshov, Vitaly Shmatikov, Alexander M. Rush | Published: 2023-10-10
メンバーシップ推論
モデルインバージョン
モデル評価

The Reversal Curse: LLMs trained on “A is B” fail to learn “B is A”

Authors: Lukas Berglund, Meg Tong, Max Kaufmann, Mikita Balesni, Asa Cooper Stickland, Tomasz Korbak, Owain Evans | Published: 2023-09-21 | Updated: 2024-05-26
ハルシネーション
モデル評価
学習データの偏り

Fast Yet Effective Machine Unlearning

Authors: Ayush K Tarun, Vikram S Chundawat, Murari Mandal, Mohan Kankanhalli | Published: 2021-11-17 | Updated: 2023-05-31
マシン・アンラーニング
モデル評価
ロバスト性に関する評価

End-to-end anti-spoofing with RawNet2

Authors: Hemlata Tak, Jose Patino, Massimiliano Todisco, Andreas Nautsch, Nicholas Evans, Anthony Larcher | Published: 2020-11-02 | Updated: 2021-12-16
ディープフェイクの検知
モデル評価
音声認識プロセス

Metadata-Based Detection of Child Sexual Abuse Material

Authors: Mayana Pereira, Rahul Dodhia, Hyrum Anderson, Richard Brown | Published: 2020-10-05 | Updated: 2021-10-27
データセット評価
モデル評価
機械学習

Approximate Data Deletion from Machine Learning Models

Authors: Zachary Izzo, Mary Anne Smart, Kamalika Chaudhuri, James Zou | Published: 2020-02-24 | Updated: 2021-02-23
マシン・アンラーニング
モデル評価
ロバスト性に関する評価