Learning from Few Samples: A Novel Approach for High-Quality Malcode Generation Authors: Haijian Ma, Daizong Liu, Xiaowen Cai, Pan Zhou, Yulai Xie | Published: 2025-08-25 データ生成手法トレーニング手法透かし 2025.08.25 文献データベース
Consiglieres in the Shadow: Understanding the Use of Uncensored Large Language Models in Cybercrimes Authors: Zilong Lin, Zichuan Li, Xiaojing Liao, XiaoFeng Wang | Published: 2025-08-18 LLMの安全機構の解除データ生成手法出力の有害度の算出 2025.08.18 文献データベース
Large Language Model-Based Framework for Explainable Cyberattack Detection in Automatic Generation Control Systems Authors: Muhammad Sharshar, Ahmad Mohammad Saber, Davor Svetinovic, Amr M. Youssef, Deepa Kundur, Ehab F. El-Saadany | Published: 2025-07-29 | Updated: 2025-08-26 インダイレクトプロンプトインジェクションデータ生成手法ハイブリッドアルゴリズム 2025.07.29 文献データベース
Can LLMs Handle WebShell Detection? Overcoming Detection Challenges with Behavioral Function-Aware Framework Authors: Feijiang Han, Jiaming Zhang, Chuyi Deng, Jianheng Tang, Yunhuai Liu | Published: 2025-04-14 | Updated: 2025-08-26 データ生成手法プログラム解析プロンプトリーキング 2025.04.14 文献データベース
Anomaly-Flow: A Multi-domain Federated Generative Adversarial Network for Distributed Denial-of-Service Detection Authors: Leonardo Henrique de Melo, Gustavo de Carvalho Bertoli, Michele Nogueira, Aldri Luiz dos Santos, Lourenço Alves Pereira Junior | Published: 2025-03-18 サイバー脅威データ生成手法攻撃手法 2025.03.18 2025.04.03 文献データベース
Winning the MIDST Challenge: New Membership Inference Attacks on Diffusion Models for Tabular Data Synthesis Authors: Xiaoyu Wu, Yifei Pang, Terrance Liu, Steven Wu | Published: 2025-03-15 データ生成手法メンバーシップ開示リスク攻撃手法 2025.03.15 2025.04.03 文献データベース
Synthesizing Access Control Policies using Large Language Models Authors: Adarsh Vatsa, Pratyush Patel, William Eiers | Published: 2025-03-14 AIによる出力のバイアスの検出データ生成手法プライバシー設計原則 2025.03.14 2025.04.03 文献データベース
KTO: Model Alignment as Prospect Theoretic Optimization Authors: Kawin Ethayarajh, Winnie Xu, Niklas Muennighoff, Dan Jurafsky, Douwe Kiela | Published: 2024-02-02 | Updated: 2024-11-19 アライメントデータ生成手法深層学習 2024.02.02 2025.04.03 文献データベース
Llama Guard: LLM-based Input-Output Safeguard for Human-AI Conversations Authors: Hakan Inan, Kartikeya Upasani, Jianfeng Chi, Rashi Rungta, Krithika Iyer, Yuning Mao, Michael Tontchev, Qing Hu, Brian Fuller, Davide Testuggine, Madian Khabsa | Published: 2023-12-07 アライメントデータ生成手法リスク分析手法 2023.12.07 2025.04.03 文献データベース
A General Theoretical Paradigm to Understand Learning from Human Preferences Authors: Mohammad Gheshlaghi Azar, Mark Rowland, Bilal Piot, Daniel Guo, Daniele Calandriello, Michal Valko, Rémi Munos | Published: 2023-10-18 | Updated: 2023-11-22 アライメントデータ生成手法深層学習 2023.10.18 2025.04.03 文献データベース