DP-2Stage: Adapting Language Models as Differentially Private Tabular Data Generators Authors: Tejumade Afonja, Hui-Po Wang, Raouf Kerkouche, Mario Fritz | Published: 2024-12-03 | Updated: 2025-04-29 プライバシー侵害合成データ生成差分プライバシー 2024.12.03 文献データベース
Intermediate Outputs Are More Sensitive Than You Think Authors: Tao Huang, Qingyu Huang, Jiayang Meng | Published: 2024-12-01 プライバシー保護メンバーシップ推論 2024.12.01 2025.04.03 文献データベース
VLSBench: Unveiling Visual Leakage in Multimodal Safety Authors: Xuhao Hu, Dongrui Liu, Hao Li, Xuanjing Huang, Jing Shao | Published: 2024-11-29 | Updated: 2025-01-17 プロンプトインジェクション安全性アライメント 2024.11.29 2025.04.03 文献データベース
LUMIA: Linear probing for Unimodal and MultiModal Membership Inference Attacks leveraging internal LLM states Authors: Luis Ibanez-Lissen, Lorena Gonzalez-Manzano, Jose Maria de Fuentes, Nicolas Anciaux, Joaquin Garcia-Alfaro | Published: 2024-11-29 | Updated: 2025-01-10 LLM性能評価メンバーシップ推論 2024.11.29 2025.04.03 文献データベース
CantorNet: A Sandbox for Testing Geometrical and Topological Complexity Measures Authors: Michal Lewandowski, Hamid Eghbalzadeh, Bernhard A. Moser | Published: 2024-11-29 | Updated: 2025-01-28 フレームワーク 2024.11.29 2025.04.03 文献データベース
Immune: Improving Safety Against Jailbreaks in Multi-modal LLMs via Inference-Time Alignment Authors: Soumya Suvra Ghosal, Souradip Chakraborty, Vaibhav Singh, Tianrui Guan, Mengdi Wang, Ahmad Beirami, Furong Huang, Alvaro Velasquez, Dinesh Manocha, Amrit Singh Bedi | Published: 2024-11-27 | Updated: 2025-03-20 プロンプトインジェクション安全性アライメント敵対的攻撃 2024.11.27 2025.04.03 文献データベース
Evaluating and Improving the Robustness of Security Attack Detectors Generated by LLMs Authors: Samuele Pasini, Jinhan Kim, Tommaso Aiello, Rocio Cabrera Lozoya, Antonino Sabetta, Paolo Tonella | Published: 2024-11-27 | Updated: 2025-09-17 RAGRAGへのポイズニング攻撃評価手法 2024.11.27 文献データベース
SoK: Decentralized AI (DeAI) Authors: Zhipeng Wang, Rui Sun, Elizabeth Lui, Vatsal Shah, Xihan Xiong, Jiahao Sun, Davide Crapis, William Knottenbelt | Published: 2024-11-26 | Updated: 2025-04-16 ブロックチェーン統合分散学習透かし設計 2024.11.26 文献データベース
CleanVul: Automatic Function-Level Vulnerability Detection in Code Commits Using LLM Heuristics Authors: Yikun Li, Ting Zhang, Ratnadira Widyasari, Yan Naing Tun, Huu Hung Nguyen, Tan Bui, Ivana Clairine Irsan, Yiran Cheng, Xiang Lan, Han Wei Ang, Frank Liauw, Martin Weyssow, Hong Jin Kang, Eng Lieh Ouh, Lwin Khin Shar, David Lo | Published: 2024-11-26 | Updated: 2025-01-16 LLM性能評価コード変更分析脆弱性管理 2024.11.26 2025.04.03 文献データベース
ThreatModeling-LLM: Automating Threat Modeling using Large Language Models for Banking System Authors: Tingmin Wu, Shuiqiao Yang, Shigang Liu, David Nguyen, Seung Jang, Alsharif Abuadbba | Published: 2024-11-26 | Updated: 2025-05-14 AIによる出力のバイアスの検出プロンプトリーキング脅威モデリング自動化 2024.11.26 文献データベース