文献データベース

RoguePrompt: Dual-Layer Ciphering for Self-Reconstruction to Circumvent LLM Moderation

Authors: Benyamin Tafreshian | Published: 2025-11-24

インダイレクトプロンプトインジェクション

プロンプトリーキング

悪意のあるプロンプト

2025.11.24

文献データベース

Evaluation of Real-Time Mitigation Techniques for Cyber Security in IEC 61850 / IEC 62351 Substations

Authors: Akila Herath, Chen-Ching Liu, Junho Hong, Kuchan Park | Published: 2025-11-24

DoS対策

異常検知アルゴリズム

透かし技術

2025.11.24

文献データベース

Subtract the Corruption: Training-Data-Free Corrective Machine Unlearning using Task Arithmetic

Authors: Mostafa Mozafari, Farooq Ahmad Wani, Maria Sofia Bucarelli, Fabrizio Silvestri | Published: 2025-11-24

トリガーの検知

バックドアモデルの検知

適応型再訓練メカニズム

2025.11.24

文献データベース

Q-MLLM: Vector Quantization for Robust Multimodal Large Language Model Security

Authors: Wei Zhao, Zhe Li, Yige Li, Jun Sun | Published: 2025-11-20

プロンプトリーキング

堅牢性向上手法

生成AI向け電子透かし

2025.11.20

文献データベース

PSM: Prompt Sensitivity Minimization via LLM-Guided Black-Box Optimization

Authors: Huseein Jawad, Nicolas Brunel | Published: 2025-11-20

プライバシー保護データマイニング

プロンプトリーキング

悪意のあるプロンプト

2025.11.20

文献データベース

ART: A Graph-based Framework for Investigating Illicit Activity in Monero via Address-Ring-Transaction Structures

Authors: Andrea Venturi, Imanol Jerico-Yoldi, Francesco Zola, Raul Orduna | Published: 2025-11-20

プライバシー保護データマイニング

ブロックチェーン技術

行動分析手法

2025.11.20

文献データベース

Small Language Models for Phishing Website Detection: Cost, Performance, and Privacy Trade-Offs

Authors: Georg Goldenits, Philip Koenig, Sebastian Raubitzek, Andreas Ekelhart | Published: 2025-11-19

フィッシング検出手法

プロンプトインジェクション

プロンプトエンジニアリング

2025.11.19

文献データベース

Taxonomy, Evaluation and Exploitation of IPI-Centric LLM Agent Defense Frameworks

Authors: Zimo Ji, Xunguang Wang, Zongjie Li, Pingchuan Ma, Yudong Gao, Daoyuan Wu, Xincheng Yan, Tian Tian, Shuai Wang | Published: 2025-11-19

インダイレクトプロンプトインジェクション

プロンプトリーキング

適応型誤用検出

2025.11.19

文献データベース

Can MLLMs Detect Phishing? A Comprehensive Security Benchmark Suite Focusing on Dynamic Threats and Multimodal Evaluation in Academic Environments

Authors: Jingzhuo Zhou | Published: 2025-11-19

プライバシーリスク管理

プロンプトインジェクション

大規模言語モデル

2025.11.19

文献データベース

Towards Classifying Benign And Malicious Packages Using Machine Learning

Authors: Thanh-Cong Nguyen, Ngoc-Thanh Nguyen, Van-Giau Ung, Duc-Ly Vu | Published: 2025-11-19

動的ポリシー適応

性能評価指標

悪意のある行為者の分類

2025.11.19

文献データベース