文献データベース

Dummy Backdoor as a Defense: Removing Unknown Backdoors via Shared Internal Mechanisms for Generative LLMs

Authors: Kazuki Iwahana, Masaru Matsubayashi, Takuma Koyama, Toshiki Shibahara, Kenichiro Omintato, Akira Ito | Published: 2026-06-10
バックドア攻撃用の毒データの検知
プロンプトリーキング
ロバスト性向上手法

Defense Against Prompt Inversion Attacks: An Information-Theoretic Approach for LLM Collaborative Inference

Authors: Sayedeh Leila Noorbakhsh, Hossein Khalili, Nader Sehatbakhsh | Published: 2026-06-10
インダイレクトプロンプトインジェクション
プライバシー保護技術
プロンプトの検証

Hiding the Trees in the Forest: Building Network Covert Channels with Hash-Based Covert Carrier Filtering

Authors: Zexiao Zou, Zhiqiang Wang, Baoxu Liu, Yuyang Han, Yan Zhang | Published: 2026-06-10
データ中心のセキュリティ
ロバスト性向上
透かし技術

OpenPCC: Open and Confidential LLM Serving on Commodity TEEs

Authors: Haoling Zhou, Shixuan Zhao, Chao Wang, Zhiqiang Lin | Published: 2026-06-09
データ中心のセキュリティ
パフォーマンス評価
プロンプトリーキング

Context-Based Adversarial Attacks on AI Code Generators: Vulnerability Analysis and Implications

Authors: Walther A. Del Orbe, John D. Hastings, Varghese Vaidyan | Published: 2026-06-09
データ駆動型脆弱性評価
プロンプトリーキング
モデルインバージョン

Comparative Analysis of Inference-Time Defense Methods for Multimodal Large Language Models

Authors: Bulat Nutfullin, Vladimir Evgrafov, Dmitry Namiot | Published: 2026-06-09
データ駆動型脆弱性評価
モデル抽出攻撃
防御的欺瞞

Toward Secure LLM Agents: Threat Surfaces, Attacks, Defenses, and Evaluation

Authors: Yuchen Ling, Shengcheng Yu, Zhenyu Chen, Chunrong Fang | Published: 2026-06-09
インダイレクトプロンプトインジェクション
データ中心のセキュリティ
バックドアモデルの検知

Do LLMsMakeNeural Distinguishers Wise?

Authors: Tatsuya Sakagami, Masashi Hisai, Naoto Yanai | Published: 2026-06-09
LLMの応用
データ生成
プロンプトリーキング

Improving Adversarial Transferability on Vision-Language Pre-training Models via Surrogate-Specific Bias Correction

Authors: Lijia Yu, Jiuxin Cao, Yuchen Qiang, Changhao Chen, Yifei Huang, Bo Liu | Published: 2026-06-09
モデルの頑健性保証
ロバスト性向上
敵対的攻撃分析

Advancing the State-of-the-Art in Empirical Privacy Auditing

Authors: Nicole Mitchell, Galen Andrew, Arun Ganesh, Brendan McMahan, Peter Kairouz | Published: 2026-06-09
データ生成
プライバシー保護技術
差分プライバシー