Tight and Practical Privacy Auditing for Differentially Private In-Context Learning Authors: Yuyang Xia, Ruixuan Liu, Li Xiong | Published: 2025-11-17 プライバシー手法匿名化技術差分プライバシー 2025.11.17 文献データベース
Enhancing All-to-X Backdoor Attacks with Optimized Target Class Mapping Authors: Lei Wang, Yulong Tian, Hao Han, Fengyuan Xu | Published: 2025-11-17 トリガーの検知バックドア攻撃透かし評価 2025.11.17 文献データベース
Whistledown: Combining User-Level Privacy with Conversational Coherence in LLMs Authors: Chelsea McMurray, Hayder Tirmazi | Published: 2025-11-17 プライバシーリスク管理プライバシー保証プライバシー手法 2025.11.17 文献データベース
DualTAP: A Dual-Task Adversarial Protector for Mobile MLLM Agents Authors: Fuyao Zhang, Jiaming Zhang, Che Wang, Xiongtao Sun, Yurong Hao, Guowei Guan, Wenjie Li, Longtao Huang, Wei Yang Bryan Lim | Published: 2025-11-17 プライバシー手法生成モデル透かし評価 2025.11.17 文献データベース
SmartPoC: Generating Executable and Validated PoCs for Smart Contract Bug Reports Authors: Longfei Chen, Ruibin Yan, Taiyu Wong, Yiyang Chen, Chao Zhang | Published: 2025-11-17 性能評価指標自動生成フレームワーク透かし評価 2025.11.17 文献データベース
SafeGRPO: Self-Rewarded Multimodal Safety Alignment via Rule-Governed Policy Optimization Authors: Xuankun Rong, Wenke Huang, Tingfeng Wang, Daiguo Zhou, Bo Du, Mang Ye | Published: 2025-11-17 プライバシー手法不適切コンテンツ生成倫理的選択評価 2025.11.17 文献データベース
SGuard-v1: Safety Guardrail for Large Language Models Authors: JoonHo Lee, HyeonMin Cho, Jaewoong Yun, Hyunjae Lee, JunKyu Lee, Juree Seok | Published: 2025-11-16 プロンプトインジェクション悪意のあるプロンプト適応型誤用検出 2025.11.16 文献データベース
SeedAIchemy: LLM-Driven Seed Corpus Generation for Fuzzing Authors: Aidan Wen, Norah A. Alzahrani, Jingzhi Jiang, Andrew Joe, Karen Shieh, Andy Zhang, Basel Alomair, David Wagner | Published: 2025-11-16 バグ検出手法プロンプトインジェクション情報セキュリティ 2025.11.16 文献データベース
GRAPHTEXTACK: A Realistic Black-Box Node Injection Attack on LLM-Enhanced GNNs Authors: Jiaji Ma, Puja Trivedi, Danai Koutra | Published: 2025-11-16 RAGへのポイズニング攻撃悪意のある行為者の分類情報セキュリティ 2025.11.16 文献データベース
The ‘Sure’ Trap: Multi-Scale Poisoning Analysis of Stealthy Compliance-Only Backdoors in Fine-Tuned Large Language Models Authors: Yuting Tan, Yi Huang, Zhuo Li | Published: 2025-11-16 トリガーの検知バックドアモデルの検知バックドア攻撃 2025.11.16 文献データベース