文献データベース

文献データベースでは、AIセキュリティに関する文献情報を分類・集約しています。詳しくは文献データベースについてをご覧ください。
The Literature Database categorizes and aggregates literature related to AI security. For more details, please see About Literature Database.

Defending Against Prompt Injection With a Few DefensiveTokens

Authors: Sizhe Chen, Yizhu Wang, Nicholas Carlini, Chawin Sitawarin, David Wagner | Published: 2025-07-10
インダイレクトプロンプトインジェクション
プロンプトリーキング
防御手法

Can Large Language Models Improve Phishing Defense? A Large-Scale Controlled Experiment on Warning Dialogue Explanations

Authors: Federico Maria Cau, Giuseppe Desolda, Francesco Greco, Lucio Davide Spano, Luca Viganò | Published: 2025-07-10
インダイレクトプロンプトインジェクション
パフォーマンス評価
プロンプトインジェクション

GuardVal: Dynamic Large Language Model Jailbreak Evaluation for Comprehensive Safety Testing

Authors: Peiyan Zhang, Haibo Jin, Liying Kang, Haohan Wang | Published: 2025-07-10
プロンプトの検証
大規模言語モデル
性能評価指標

May I have your Attention? Breaking Fine-Tuning based Prompt Injection Defenses using Architecture-Aware Attacks

Authors: Nishit V. Pandya, Andrey Labunets, Sicun Gao, Earlence Fernandes | Published: 2025-07-10
インダイレクトプロンプトインジェクション
敵対的攻撃
防御手法

Hybrid LLM-Enhanced Intrusion Detection for Zero-Day Threats in IoT Networks

Authors: Mohammad F. Al-Hammouri, Yazan Otoum, Rasha Atwa, Amiya Nayak | Published: 2025-07-10
ハイブリッドアルゴリズム
プロンプトインジェクション
大規模言語モデル

Phishing Detection in the Gen-AI Era: Quantized LLMs vs Classical Models

Authors: Jikesh Thapa, Gurrehmat Chahal, Serban Voinea Gabreanu, Yazan Otoum | Published: 2025-07-10
パフォーマンス評価
プロンプトインジェクション
次世代フィッシング検出

ZKTorch: Compiling ML Inference to Zero-Knowledge Proofs via Parallel Proof Accumulation

Authors: Bing-Jyue Chen, Lilia Tang, Daniel Kang | Published: 2025-07-09
パフォーマンス評価
多項式近似
計算問題

BarkBeetle: Stealing Decision Tree Models with Fault Injection

Authors: Qifan Wang, Jonas Sander, Minmin Jiang, Thomas Eisenbarth, David Oswald | Published: 2025-07-09
モデル抽出攻撃
敵対的攻撃
特徴選択手法

Unifying Re-Identification, Attribute Inference, and Data Reconstruction Risks in Differential Privacy

Authors: Bogdan Kulynych, Juan Felipe Gomez, Georgios Kaissis, Jamie Hayes, Borja Balle, Flavio du Pin Calmon, Jean Louis Raisaro | Published: 2025-07-09
プライバシーリスク管理
リスク管理
差分プライバシー

The Dark Side of LLMs Agent-based Attacks for Complete Computer Takeover

Authors: Matteo Lupinacci, Francesco Aurelio Pironti, Francesco Blefari, Francesco Romeo, Luigi Arena, Angelo Furfaro | Published: 2025-07-09
RAGへのポイズニング攻撃
インダイレクトプロンプトインジェクション
バックドアモデルの検知