文献データベース

Beyond Safe Data: Pretraining-Stage Alignment with Regular Safety Reflection

Authors: Jinhan Li, Kexian Tang, Yihan Xu, Zhuorui Ye, Kaifeng Lyu | Published: 2026-06-17
モデルの堅牢性
安全性反映トレーニング
敵対的学習

OpenAnt: LLM-Powered Vulnerability Discovery Through Code Decomposition, Adversarial Verification, and Dynamic Testing

Authors: Nahum Korda, Gadi Evron | Published: 2026-06-17
プロンプトリーキング
脆弱性検出手法
評価基準

Giskard : Byzantine Robust and Confidential Aggregation for Large-Scale Decentralized Learning

Authors: Ousmane Touat, César Sabater, Mohamed Maouche, Sonia Ben Mokhtar | Published: 2026-06-17
ビザンチン合意メカニズム
分散学習プラットフォーム
連合学習

PYPILINE: Malicious PyPI Package Detection via Suspicious API Knowledge and Agent Workflow

Authors: Siyuan Pang, Zhengwei Jiang, Yepeng Yao, Zijing Fan, Haozhe Li, Baoxu Liu | Published: 2026-06-17
オンラインマルウェア検出
プロンプトインジェクション
マルウェアファミリー

Lifecycle-Aware Dynamic Analysis for Secure ML Model Execution

Authors: Gabriele Digregorio, Marco Di Gennaro, Francesco Pastore, Stefano Zanero, Stefano Longari, Michele Carminati | Published: 2026-06-17
モデルの堅牢性
機械学習
脆弱性検出手法

TRAP: Benchmark for Task-completion and Resistance to Active Privacy-extraction

Authors: Moon Ye-Bin, Nam Hyeon-Woo, Baek Seong-Eun, Yejin Yeo, Tae-Hyun Oh | Published: 2026-06-17
タスク特化型チューニング
プライバシー保証
プライバシー保護手法

Image Prompt Reconstruction Attacks on Distributed MLLM Inference Frameworks

Authors: Xinjian Luo, Hongyan Chang, Jianxin Wei, Yuncheng Wu, Xiaofeng Gao, Meikang Qiu, Ting Yu, Xue Liu | Published: 2026-06-17
プロンプトリーキング
モデル抽出攻撃
画像分類手法

Understanding and Mitigating Prompt Leaking Attacks in Real-World LLM-Based Applications

Authors: Yong Yang, Chong Fu, Tong Zhang, Rui Zeng, Qingming Li, Tianyu Du, Zonghui Wang, Shouling Ji, Wenzhi Chen | Published: 2026-06-17
データ漏洩
プロンプトリーキング
モデル抽出攻撃

MIDS: Detecting Stealthy Masquerade and Tampering Attacks on CAN Bus via Bidirectional Mamba

Authors: Qiqi Liu, Runhan Song, Lei Cui, Heng Zhang, Yuyan Sun, Limin Sun | Published: 2026-06-17
データセット分析
データ依存性
異常検出手法

Learning Red Agent Policy from Observations for Neurosymbolic Autonomous Cyber Agents

Authors: Ankita Samaddar, Sandeep Neema, Daniel Balasubramanian, Xenofon Koutsoukos | Published: 2026-06-16
ポリシー学習
脆弱性研究
防御メカニズム