文献データベース

Protection against Source Inference Attacks in Federated Learning

Authors: Andreas Athanasiou, Kangsoo Jung, Catuscia Palamidessi | Published: 2026-03-02

セキュアアグリゲーション

トリガーの検知

ポイズニング

2026.03.02

文献データベース

Real Money, Fake Models: Deceptive Model Claims in Shadow APIs

Authors: Yage Zhang, Yukun Jiang, Zeyuan Chen, Michael Backes, Xinyue Shen, Yang Zhang | Published: 2026-03-02

LLM性能評価

データプライバシー管理

2026.03.02

文献データベース

Co-Evolutionary Multi-Modal Alignment via Structured Adversarial Evolution

Authors: Guoxin Shi, Haoyu Wang, Zaihui Yang, Yuxing Wang, Yongzhe Chang | Published: 2026-03-02

アライメント

安全性評価

機械学習応用

2026.03.02

文献データベース

DualSentinel: A Lightweight Framework for Detecting Targeted Attacks in Black-box LLM via Dual Entropy Lull Pattern

Authors: Xiaoyi Pang, Xuanyi Hao, Pengyu Liu, Qi Luo, Song Guo, Zhibo Wang | Published: 2026-03-02

LLM性能評価

インダイレクトプロンプトインジェクション

プロンプトインジェクション

2026.03.02

文献データベース

From Secure Agentic AI to Secure Agentic Web: Challenges, Threats, and Future Directions

Authors: Zhihang Deng, Jiaping Gui, Weinan Zhang | Published: 2026-03-02

インダイレクトプロンプトインジェクション

安全性評価

脅威モデル

2026.03.02

文献データベース

Towards Privacy-Preserving LLM Inference via Collaborative Obfuscation (Technical Report)

Authors: Yu Lin, Qizhi Zhang, Wenqiang Ruan, Daode Zhang, Jue Hong, Ye Wu, Hanning Xia, Yunlong Mao, Sheng Zhong | Published: 2026-03-02

LLMの安全機構の解除

LLM性能評価

差分プライバシー

2026.03.02

文献データベース

Inference-Time Safety For Code LLMs Via Retrieval-Augmented Revision

Authors: Manisha Mukherjee, Vincent J. Hellendoorn | Published: 2026-03-02

インダイレクトプロンプトインジェクション

セキュリティに関連する知識を活用した手法

プロンプトリーキング

2026.03.02

文献データベース

LLM Novice Uplift on Dual-Use, In Silico Biology Tasks

Authors: Chen Bo Calvin Zhang, Christina Q. Knight, Nicholas Kruus, Jason Hausenloy, Pedro Medeiros, Nathaniel Li, Aiden Kim, Yury Orlovskiy, Coleman Breen, Bryce Cai, Jasper Götting, Andrew Bo Liu, Samira Nedungadi, Paula Rodriguez, Yannis Yiming He, Mohamed Shaaban, Zifan Wang, Seth Donoughe, Julian Michael | Published: 2026-02-26

LLM性能評価

モデル評価手法

教育データマイニング

2026.02.26

文献データベース

A Decision-Theoretic Formalisation of Steganography With Applications to LLM Monitoring

Authors: Usman Anwar, Julianna Piskorz, David D. Baek, David Africa, Jim Weatherall, Max Tegmark, Christian Schroeder de Witt, Mihaela van der Schaar, David Krueger | Published: 2026-02-26

ウォーターマーキング

データ管理システム

モデル評価手法

2026.02.26

文献データベース

Assessing Deanonymization Risks with Stylometry-Assisted LLM Agent

Authors: Boyang Zhang, Yang Zhang | Published: 2026-02-26

LLMの安全機構の解除

データプライバシー評価

プロンプトリーキング

2026.02.26

文献データベース