安全性と有用性のトレードオフ

$\texttt{SAGE}$: A Generic Framework for LLM Safety Evaluation

Authors: Madhur Jindal, Hari Shrawgi, Parag Agrawal, Sandipan Dandapat | Published: 2025-04-28
ユーザー識別システム
大規模言語モデル
安全性と有用性のトレードオフ