AIセキュリティポータルbot

Categorical Robustness Assessment for Machine Learning based Network Intrusion Detection Systems

Authors: Mayank Raj, Nathaniel D. Bastian, Lance Fiondella, Gokhan Kul | Published: 2026-06-10
モデルの頑健性保証
ロバスト性向上
敵対的学習

Online Shift Detection and Conformal Adaptation for Deployed Safety Classifiers

Authors: Jun Wen Leong | Published: 2026-06-10
システム観測性
異常検知
統計的手法

Grammar-Constrained Decoding Can Jailbreak LLMs into Generating Malicious Code

Authors: Yitong Zhang, Shiteng Lu, Jia Li | Published: 2026-06-10
プロンプトインジェクション
大規模言語モデル
安全性の整合性

Can Open-Source LLM Agents Replace Static Application Security Testing Tools? An Empirical Assessment

Authors: Derek Yohn, Luke Flancher, Mirajul Islam, Khaled Slhoub | Published: 2026-06-10
インダイレクトプロンプトインジェクション
データ駆動型脆弱性評価
静的アプリケーションセキュリティテスト

Dummy Backdoor as a Defense: Removing Unknown Backdoors via Shared Internal Mechanisms for Generative LLMs

Authors: Kazuki Iwahana, Masaru Matsubayashi, Takuma Koyama, Toshiki Shibahara, Kenichiro Omintato, Akira Ito | Published: 2026-06-10
バックドア攻撃用の毒データの検知
プロンプトリーキング
ロバスト性向上手法

Defense Against Prompt Inversion Attacks: An Information-Theoretic Approach for LLM Collaborative Inference

Authors: Sayedeh Leila Noorbakhsh, Hossein Khalili, Nader Sehatbakhsh | Published: 2026-06-10
インダイレクトプロンプトインジェクション
プライバシー保護技術
プロンプトの検証

Hiding the Trees in the Forest: Building Network Covert Channels with Hash-Based Covert Carrier Filtering

Authors: Zexiao Zou, Zhiqiang Wang, Baoxu Liu, Yuyang Han, Yan Zhang | Published: 2026-06-10
データ中心のセキュリティ
ロバスト性向上
透かし技術

OpenPCC: Open and Confidential LLM Serving on Commodity TEEs

Authors: Haoling Zhou, Shixuan Zhao, Chao Wang, Zhiqiang Lin | Published: 2026-06-09
データ中心のセキュリティ
パフォーマンス評価
プロンプトリーキング

Context-Based Adversarial Attacks on AI Code Generators: Vulnerability Analysis and Implications

Authors: Walther A. Del Orbe, John D. Hastings, Varghese Vaidyan | Published: 2026-06-09
データ駆動型脆弱性評価
プロンプトリーキング
モデルインバージョン

Comparative Analysis of Inference-Time Defense Methods for Multimodal Large Language Models

Authors: Bulat Nutfullin, Vladimir Evgrafov, Dmitry Namiot | Published: 2026-06-09
データ駆動型脆弱性評価
モデル抽出攻撃
防御的欺瞞