Tuning without Peeking: Provable Privacy and Generalization Bounds for LLM Post-Training Authors: Ismail Labiad, Mathurin Videau, Matthieu Kowalski, Marc Schoenauer, Alessandro Leite, Julia Kempe, Olivier Teytaud | Published: 2025-07-02 RAGプライバシー保証差分プライバシー 2025.07.02 文献データベース
Graph Representation-based Model Poisoning on Federated LLMs in CyberEdge Networks Authors: Hanlin Cai, Haofan Dong, Houtianfu Wang, Kai Li, Ozgur B. Akan | Published: 2025-07-02 プロンプトインジェクションポイズニング攻撃悪意のあるクライアント 2025.07.02 文献データベース
A Privacy-Preserving Indoor Localization System based on Hierarchical Federated Learning Authors: Masood Jan, Wafa Njima, Xun Zhang | Published: 2025-07-02 プライバシー保証分散学習性能評価 2025.07.02 文献データベース
SafePTR: Token-Level Jailbreak Defense in Multimodal LLMs via Prune-then-Restore Mechanism Authors: Beitao Chen, Xinyu Lyu, Lianli Gao, Jingkuan Song, Heng Tao Shen | Published: 2025-07-02 プロンプトインジェクション脱獄攻撃手法透明性と検証 2025.07.02 文献データベース
ICLShield: Exploring and Mitigating In-Context Learning Backdoor Attacks Authors: Zhiyao Ren, Siyuan Liang, Aishan Liu, Dacheng Tao | Published: 2025-07-02 ICL防御メカニズムトリガーの検知バックドア攻撃手法 2025.07.02 文献データベース
Gaze3P: Gaze-Based Prediction of User-Perceived Privacy Authors: Mayar Elfares, Pascal Reisert, Ralf Küsters, Andreas Bulling | Published: 2025-07-01 | Updated: 2025-09-10 プライバシー手法プライバシー評価研究方法論 2025.07.01 文献データベース
Are AI-Generated Fixes Secure? Analyzing LLM and Agent Patches on SWE-bench Authors: Amirali Sajadi, Kostadin Damevski, Preetha Chatterjee | Published: 2025-06-30 | Updated: 2025-07-24 ソフトウェアセキュリティプロンプトインジェクション大規模言語モデル 2025.06.30 文献データベース
AI Risk-Management Standards Profile for General-Purpose AI (GPAI) and Foundation Models Authors: Anthony M. Barrett, Jessica Newman, Brandie Nonnecke, Nada Madkour, Dan Hendrycks, Evan R. Murphy, Krystal Jackson, Deepika Raman | Published: 2025-06-30 モデルインバージョンリスク評価手法教育やフォローアップ 2025.06.30 文献データベース
PBa-LLM: Privacy- and Bias-aware NLP using Named-Entity Recognition (NER) Authors: Gonzalo Mancera, Aythami Morales, Julian Fierrez, Ruben Tolosana, Alejandro Penna, Miguel Lopez-Duran, Francisco Jurado, Alvaro Ortigosa | Published: 2025-06-30 | Updated: 2025-07-09 バイアスパフォーマンス評価プライバシーリスク管理 2025.06.30 文献データベース
RawMal-TF: Raw Malware Dataset Labeled by Type and Family Authors: David Bálik, Martin Jureček, Mark Stamp | Published: 2025-06-30 バックドアモデルの検知プロンプトインジェクションマルウェア分類のためのデータセット 2025.06.30 文献データベース