AIセキュリティポータルbot

SoK: a Comprehensive Causality Analysis Framework for Large Language Model Security

Authors: Wei Zhao, Zhe Li, Jun Sun | Published: 2025-12-04
プロンプトインジェクション
因果推論
大規模言語モデル

ASTRIDE: A Security Threat Modeling Platform for Agentic-AI Applications

Authors: Eranga Bandara, Amin Hass, Ross Gore, Sachin Shetty, Ravi Mukkamala, Safdar H. Bouk, Xueping Liang, Ng Wee Keong, Kasun De Zoysa, Aruna Withanage, Nilaan Loganathan | Published: 2025-12-04
インダイレクトプロンプトインジェクション
サイバーセキュリティ
脅威モデリング

Exploiting \texttt{ftrace}’s \texttt{function\_graph} Tracer Features for Machine Learning: A Case Study on Encryption Detection

Authors: Kenan Begovic, Abdulaziz Al-Ali, Qutaibah Malluhi | Published: 2025-12-04
サイバーセキュリティ
データセット分析
機械学習応用

A Light-Weight Large Language Model File Format for Highly-Secure Model Distribution

Authors: Huifeng Zhu, Shijie Li, Qinfeng Li, Yier Jin | Published: 2025-12-04
モデルDoS
モデル抽出攻撃の検知
情報セキュリティ

In-Context Representation Hijacking

Authors: Itay Yona, Amir Sarid, Michael Karasik, Yossi Gandelsman | Published: 2025-12-03
サイバーセキュリティ
プロンプトインジェクション
プロンプトリーキング

Context-Aware Hierarchical Learning: A Two-Step Paradigm towards Safer LLMs

Authors: Tengyun Ma, Jiaqi Yao, Daojing He, Shihao Peng, Yu Li, Shaohui Liu, Zhuotao Tian | Published: 2025-12-03
セキュリティ考慮
倫理的考慮
防御手法

SELF: A Robust Singular Value and Eigenvalue Approach for LLM Fingerprinting

Authors: Hanxiu Zhang, Yue Zheng | Published: 2025-12-03
データ生成手法
生成AI向け電子透かし
透かしの耐久性

HarnessAgent: Scaling Automatic Fuzzing Harness Construction with Tool-Augmented LLM Pipelines

Authors: Kang Yang, Yunhang Zhang, Zichuan Li, GuanHong Tao, Jun Xu, XiaoJing Liao | Published: 2025-12-03
プロンプトインジェクション
モデルDoS
自動化ペネトレーションテスト

Scaling Trust in Quantum Federated Learning: A Multi-Protocol Privacy Design

Authors: Dev Gurung, Shiva Raj Pokhrel | Published: 2025-12-03
プライバシー保護
差分プライバシー
連合学習

Immunity memory-based jailbreak detection: multi-agent adaptive guard for large language models

Authors: Jun Leng, Litian Zhang, Xi Zhang | Published: 2025-12-03
プロンプトインジェクション
メモリ化メカニズム
攻撃検出手法