Benchmarking Practices in LLM-driven Offensive Security: Testbeds, Metrics, and Experiment Design Authors: Andreas Happe, Jürgen Cito | Published: 2025-04-14 テストベッドプロンプトの検証進捗追跡 2025.04.14 文献データベース