不確実性測定

LightDefense: A Lightweight Uncertainty-Driven Defense against Jailbreaks via Shifted Token Distribution

Authors: Zhuoran Yang, Jie Peng, Zhen Tan, Tianlong Chen, Yanyong Zhang | Published: 2025-04-02
プロンプトインジェクション
モデル性能評価
不確実性測定

Bayesian Neural Networks With Maximum Mean Discrepancy Regularization

Authors: Jary Pomponi, Simone Scardapane, Aurelio Uncini | Published: 2020-03-02 | Updated: 2020-09-30
トレーニング手法
不確実性測定
最適化手法