Are AI-Generated Fixes Secure? Analyzing LLM and Agent Patches on SWE-bench Authors: Amirali Sajadi, Kostadin Damevski, Preetha Chatterjee | Published: 2025-06-30 | Updated: 2025-07-24 ソフトウェアセキュリティプロンプトインジェクション大規模言語モデル 2025.06.30 文献データベース
AI Risk-Management Standards Profile for General-Purpose AI (GPAI) and Foundation Models Authors: Anthony M. Barrett, Jessica Newman, Brandie Nonnecke, Nada Madkour, Dan Hendrycks, Evan R. Murphy, Krystal Jackson, Deepika Raman | Published: 2025-06-30 モデルインバージョンリスク評価手法教育やフォローアップ 2025.06.30 文献データベース
PBa-LLM: Privacy- and Bias-aware NLP using Named-Entity Recognition (NER) Authors: Gonzalo Mancera, Aythami Morales, Julian Fierrez, Ruben Tolosana, Alejandro Penna, Miguel Lopez-Duran, Francisco Jurado, Alvaro Ortigosa | Published: 2025-06-30 | Updated: 2025-07-09 バイアスパフォーマンス評価プライバシーリスク管理 2025.06.30 文献データベース
RawMal-TF: Raw Malware Dataset Labeled by Type and Family Authors: David Bálik, Martin Jureček, Mark Stamp | Published: 2025-06-30 バックドアモデルの検知プロンプトインジェクションマルウェア分類のためのデータセット 2025.06.30 文献データベース
Breaking Out from the TESSERACT: Reassessing ML-based Malware Detection under Spatio-Temporal Drift Authors: Theo Chow, Mario D'Onghia, Lorenz Linhardt, Zeliang Kan, Daniel Arp, Lorenzo Cavallaro, Fabio Pierazzi | Published: 2025-06-30 バイアスマルウェア分類のためのデータセット評価メトリクス 2025.06.30 文献データベース
SoK: Semantic Privacy in Large Language Models Authors: Baihe Ma, Yanna Jiang, Xu Wang, Guangshen Yu, Qin Wang, Caijun Sun, Chen Li, Xuelei Qi, Ying He, Wei Ni, Ren Ping Liu | Published: 2025-06-30 セマンティック情報抽出プライバシー保護大規模言語モデル 2025.06.30 文献データベース
A Practical and Secure Byzantine Robust Aggregator Authors: De Zhang Lee, Aashish Kolluri, Prateek Saxena, Ee-Chien Chang | Published: 2025-06-29 | Updated: 2025-07-02 RAGへのポイズニング攻撃ポイズニング攻撃ロバスト分類 2025.06.29 文献データベース
MetaCipher: A Time-Persistent and Universal Multi-Agent Framework for Cipher-Based Jailbreak Attacks for LLMs Authors: Boyuan Chen, Minghao Shao, Abdul Basit, Siddharth Garg, Muhammad Shafique | Published: 2025-06-27 | Updated: 2025-08-13 フレームワーク大規模言語モデル脱獄攻撃手法 2025.06.27 文献データベース
SPA: Towards More Stealth and Persistent Backdoor Attacks in Federated Learning Authors: Chengcheng Zhu, Ye Li, Bosen Rao, Jiale Zhang, Yunlong Mao, Sheng Zhong | Published: 2025-06-26 トリガーの検知バックドア攻撃手法連合学習 2025.06.26 文献データベース
ZKPROV: A Zero-Knowledge Approach to Dataset Provenance for Large Language Models Authors: Mina Namazi, Alexander Nemecek, Erman Ayday | Published: 2025-06-26 プライバシー保護大規模言語モデル透かし技術 2025.06.26 文献データベース