AIセキュリティポータルbot

Exploiting \texttt{ftrace}’s \texttt{function\_graph} Tracer Features for Machine Learning: A Case Study on Encryption Detection

Authors: Kenan Begovic, Abdulaziz Al-Ali, Qutaibah Malluhi | Published: 2025-12-04
サイバーセキュリティ
データセット分析
機械学習応用

A Light-Weight Large Language Model File Format for Highly-Secure Model Distribution

Authors: Huifeng Zhu, Shijie Li, Qinfeng Li, Yier Jin | Published: 2025-12-04
モデルDoS
モデル抽出攻撃の検知
情報セキュリティ

In-Context Representation Hijacking

Authors: Itay Yona, Amir Sarid, Michael Karasik, Yossi Gandelsman | Published: 2025-12-03
サイバーセキュリティ
プロンプトインジェクション
プロンプトリーキング

Context-Aware Hierarchical Learning: A Two-Step Paradigm towards Safer LLMs

Authors: Tengyun Ma, Jiaqi Yao, Daojing He, Shihao Peng, Yu Li, Shaohui Liu, Zhuotao Tian | Published: 2025-12-03
セキュリティ考慮
倫理的考慮
防御手法

SELF: A Robust Singular Value and Eigenvalue Approach for LLM Fingerprinting

Authors: Hanxiu Zhang, Yue Zheng | Published: 2025-12-03
データ生成手法
生成AI向け電子透かし
透かしの耐久性

HarnessAgent: Scaling Automatic Fuzzing Harness Construction with Tool-Augmented LLM Pipelines

Authors: Kang Yang, Yunhang Zhang, Zichuan Li, GuanHong Tao, Jun Xu, XiaoJing Liao | Published: 2025-12-03
プロンプトインジェクション
モデルDoS
自動化ペネトレーションテスト

Scaling Trust in Quantum Federated Learning: A Multi-Protocol Privacy Design

Authors: Dev Gurung, Shiva Raj Pokhrel | Published: 2025-12-03
プライバシー保護
差分プライバシー
連合学習

Immunity memory-based jailbreak detection: multi-agent adaptive guard for large language models

Authors: Jun Leng, Litian Zhang, Xi Zhang | Published: 2025-12-03
プロンプトインジェクション
メモリ化メカニズム
攻撃検出手法

Contextual Image Attack: How Visual Context Exposes Multimodal Safety Vulnerabilities

Authors: Yuan Xiong, Ziqi Miao, Lijun Li, Chen Qian, Jie Li, Jing Shao | Published: 2025-12-02
プロンプトインジェクション
モデルDoS
画像生成技術

CryptoQA: A Large-scale Question-answering Dataset for AI-assisted Cryptography

Authors: Mayar Elfares, Pascal Reisert, Tilman Dietz, Manpa Barman, Ahmed Zaki, Ralf Küsters, Andreas Bulling | Published: 2025-12-02
データセット生成
プロンプトインジェクション
プロンプトリーキング