CTRAP: Embedding Collapse Trap to Safeguard Large Language Models from Harmful Fine-Tuning Authors: Biao Yi, Tiansheng Huang, Baolei Zhang, Tong Li, Lihai Nie, Zheli Liu, Li Shen | Published: 2025-05-22 アライメントインダイレクトプロンプトインジェクション出力の有害度の算出 2025.05.22 文献データベース
DuFFin: A Dual-Level Fingerprinting Framework for LLMs IP Protection Authors: Yuliang Yan, Haochun Tang, Shuo Yan, Enyan Dai | Published: 2025-05-22 フィンガープリンティング手法プロンプトインジェクションモデル識別 2025.05.22 文献データベース
Password Strength Detection via Machine Learning: Analysis, Modeling, and Evaluation Authors: Jiazhi Mo, Hailu Kuang, Xiaoqi Li | Published: 2025-05-22 データの起源と変遷パスワードセキュリティ機械学習 2025.05.22 文献データベース
ReCopilot: Reverse Engineering Copilot in Binary Analysis Authors: Guoqiang Chen, Huiqi Sun, Daguang Liu, Zhiqi Wang, Qiang Wang, Bin Yin, Lu Liu, Lingyun Ying | Published: 2025-05-22 アライメントバイナリ分析動的分析 2025.05.22 文献データベース
SuperPure: Efficient Purification of Localized and Distributed Adversarial Patches via Super-Resolution GAN Models Authors: Hossein Khalili, Seongbin Park, Venkat Bollapragada, Nader Sehatbakhsh | Published: 2025-05-22 敵対的学習計算複雑性防御メカニズム 2025.05.22 文献データベース
Interpretable Anomaly Detection in Encrypted Traffic Using SHAP with Machine Learning Models Authors: Kalindi Singh, Aayush Kashyap, Aswani Kumar Cherukuri | Published: 2025-05-22 モデルインバージョン異常検知アルゴリズム解釈可能性の損失 2025.05.22 文献データベース
Verifying Differentially Private Median Estimation Authors: Hyukjun Kwon, Chenglin Fan | Published: 2025-05-22 プライバシー評価効率的証明システム差分プライバシー 2025.05.22 文献データベース
A Scalable Hierarchical Intrusion Detection System for Internet of Vehicles Authors: Md Ashraf Uddin, Nam H. Chu, Reza Rafeh, Mutaz Barika | Published: 2025-05-22 攻撃タイプ連合学習階層型分類モデル 2025.05.22 文献データベース
Scalable Defense against In-the-wild Jailbreaking Attacks with Safety Context Retrieval Authors: Taiye Chen, Zeming Wei, Ang Li, Yisen Wang | Published: 2025-05-21 RAG大規模言語モデル防御メカニズム 2025.05.21 文献データベース
Alignment Under Pressure: The Case for Informed Adversaries When Evaluating LLM Defenses Authors: Xiaoxue Yang, Bozhidar Stevanoski, Matthieu Meeus, Yves-Alexandre de Montjoye | Published: 2025-05-21 アライメントプロンプトインジェクション防御メカニズム 2025.05.21 文献データベース