AIセキュリティポータルbot | ページ 7 | AIセキュリティポータル

GuardNet: Ensemble Strategies of Shallow Neural Networks for Robust Prompt Injection and Jailbreak Detection

Authors: Paulo Ricardo Ferreira Neves, Edson Rodrigues da Cruz Filho, Paulo Henrique Eleuterio Falsetti, João Vitor Pavan, Ian Degaspari, Henrique Vieira Laturrague, Patrick Vieira Laturrague, Guilherme Nielsen Dias, Marccello Wilson Perez Berto, Gustavo Voltani Von Atzingen | Published: 2026-06-04

データ収集手法

プロンプトインジェクション

モデル抽出攻撃

2026.06.04

文献データベース

Agent libOS: A Library-OS-Inspired Runtime for Long-Running, Capability-Controlled LLM Agents

Authors: Yingqi Zhang | Published: 2026-06-02

アクセス制御モデル

システム開発

データ保護

2026.06.02

文献データベース

AI Agents Enable Adaptive Computer Worms

Authors: Jonas Guan, Tom Blanchard, Hanna Foerster, Hengrui Jia, Gabriel Huang, Nicolas Papernot | Published: 2026-06-02

インダイレクトプロンプトインジェクション

ペネトレーションテスト手法

マルウェア分類のためのデータセット

2026.06.02

文献データベース

Testing LLM Arithmetic Reasoning Generalization with Automatic Numeric-Remapping Attacks

Authors: Malia Barker, Bishal Lakha, Edoardo Serra, Francesco Gullo | Published: 2026-06-02

プロンプトインジェクション

プロンプトリーキング

ロバスト性評価

2026.06.02

文献データベース

Learn from Your Mistakes: Tree-like Self-Play for Secure Code LLMs

Authors: Wenqi Chen, Ziyan Zhang, Bing Wang, Lin Liu, Hengheng Zhang, Zhengsu Chen | Published: 2026-06-02

データ生成の安全性

プロンプトリーキング

リスク評価

2026.06.02

文献データベース

NeuroArmor: Safe-Variant-Guided Representation Consistency for Selective Re-Anchoring in Jailbreak Defense

Authors: Zhongyang Lin, Ziran Zhao, Feifei Zhai, Pengyuan Liu | Published: 2026-06-02

リスク評価

ロバスト性評価

大規模言語モデル

2026.06.02

文献データベース

Selective Token-Level Cryptographic Redaction for Privacy-Preserving Clinical Deployment of Large Language Models

Authors: Farhan Sheth, Ziyuan Yang, Yongying Lan, Si Yong Yeo | Published: 2026-06-02

プライバシー保護アルゴリズム

プライバシー保護機械学習

暗号化技術

2026.06.02

文献データベース

Operationalizing Cyber Attack Prediction: A Gap-Prioritized Framework with Dataset and Model Selection Guidelines

Authors: Aminu Muhammad Auwal | Published: 2026-06-02

データセット統合

敵対的サンプルの検知

解釈可能性

2026.06.02

文献データベース

FLIPS: Instance-Fingerprinting for LLMs via Pseudo-random Sequences

Authors: Gurvan Richardeau, Gohar Dashyan, Erwan Le Merrer, Gilles Tredan | Published: 2026-06-02

トークン識別手法

プロンプトインジェクション

効率性評価

2026.06.02

文献データベース

The Role of Domain-Specific Features in Malware Detection: A macOS Case Study

Authors: Biagio Montaruli, Andrea Oliveri, Savino Dambra, Davide Balzarotti | Published: 2026-06-02

API利用分析

データセット評価

機械学習によるマルウェア分類

2026.06.02

文献データベース