AIセキュリティポータルbot | ページ 52 | AIセキュリティポータル

P2P: A Poison-to-Poison Remedy for Reliable Backdoor Defense in LLMs

Authors: Shuai Zhao, Xinyi Wu, Shiqian Zhao, Xiaobao Wu, Zhongliang Guo, Yanhao Jia, Anh Tuan Luu | Published: 2025-10-06

プロンプトインジェクション

プロンプトの検証

防御手法の統合

2025.10.06

文献データベース

Autonomy Matters: A Study on Personalization-Privacy Dilemma in LLM Agents

Authors: Zhiping Zhang, Yi Evie Zhang, Freda Shi, Tianshi Li | Published: 2025-10-06

インダイレクトプロンプトインジェクション

プライバシー保護機械学習

ユーザー活動解析

2025.10.06

文献データベース

Machine Unlearning Meets Adversarial Robustness via Constrained Interventions on LLMs

Authors: Fatmazohra Rezkellah, Ramzi Dakhmouche | Published: 2025-10-03 | Updated: 2025-10-15

AIによる出力の識別

ロバスト性

大規模言語モデル

2025.10.03

文献データベース

CryptOracle: A Modular Framework to Characterize Fully Homomorphic Encryption

Authors: Cory Brynds, Parker McLeod, Lauren Caccamise, Asmita Pal, Dewan Saiham, Sazadur Rahman, Joshua San Miguel, Di Wu | Published: 2025-10-03 | Updated: 2025-10-13

エネルギーベースモデル

暗号化技術

統計的分析

2025.10.03

文献データベース

NEXUS: Network Exploration for eXploiting Unsafe Sequences in Multi-Turn LLM Jailbreaks

Authors: Javad Rafiei Asl, Sidhant Narula, Mohammad Ghasemigol, Eduardo Blanco, Daniel Takabi | Published: 2025-10-03 | Updated: 2025-10-21

プロンプトインジェクション

大規模言語モデル

脱獄手法

2025.10.03

文献データベース

Untargeted Jailbreak Attack

Authors: Xinzhe Huang, Wenjing Hu, Tianhang Zheng, Kedong Xiu, Xiaojun Jia, Di Wang, Zhan Qin, Kui Ren | Published: 2025-10-03 | Updated: 2025-10-28

プロンプトインジェクション

プロンプトリーキング

防御手法の効果分析

2025.10.03

文献データベース

UpSafe$^\circ$C: Upcycling for Controllable Safety in Large Language Models

Authors: Yuhao Sun, Zhuoer Xu, Shiwen Cui, Kun Yang, Lingyun Yu, Yongdong Zhang, Hongtao Xie | Published: 2025-10-02

AIシステムの関係性

学習の改善

防御手法の統合

2025.10.02

文献データベース

FalseCrashReducer: Mitigating False Positive Crashes in OSS-Fuzz-Gen Using Agentic AI

Authors: Paschal C. Amusuo, Dongge Liu, Ricardo Andres Calvo Mendez, Jonathan Metzman, Oliver Chang, James C. Davis | Published: 2025-10-02

プログラム解析

プロンプトインジェクション

誤検知管理

2025.10.02

文献データベース

Evaluating the Robustness of a Production Malware Detection System to Transferable Adversarial Attacks

Authors: Milad Nasr, Yanick Fratantonio, Luca Invernizzi, Ange Albertini, Loua Farah, Alex Petit-Bianco, Andreas Terzis, Kurt Thomas, Elie Bursztein, Nicholas Carlini | Published: 2025-10-02

オンラインマルウェア検出

敵対的学習

構造的攻撃

2025.10.02

文献データベース

Position: Privacy Is Not Just Memorization!

Authors: Niloofar Mireshghallah, Tianshi Li | Published: 2025-10-02

インダイレクトプロンプトインジェクション

プライバシー保護機械学習

プライバシー分類

2025.10.02

文献データベース