Phishing Detection System: An Ensemble Approach Using Character-Level CNN and Feature Engineering Authors: Rudra Dubey, Arpit Mani Tripathi, Archit Srivastava, Sarvpal Singh | Published: 2025-12-18 アンサンブル学習次世代フィッシング検出特徴抽出 2025.12.18 文献データベース
Prefix Probing: Lightweight Harmful Content Detection for Large Language Models Authors: Jirui Yang, Hengqi Guo, Zhihui Lu, Yi Zhao, Yuansen Zhang, Shijing Hu, Qiang Duan, Yinggui Wang, Tao Wei | Published: 2025-12-18 トークン分布分析プロンプトインジェクションプロンプトリーキング 2025.12.18 文献データベース
A Systematic Study of Code Obfuscation Against LLM-based Vulnerability Detection Authors: Xiao Li, Yue Li, Hao Wu, Yue Zhang, Yechao Zhang, Fengyuan Xu, Sheng Zhong | Published: 2025-12-18 インダイレクトプロンプトインジェクションプロンプトインジェクション難読化手法 2025.12.18 文献データベース
From Essence to Defense: Adaptive Semantic-aware Watermarking for Embedding-as-a-Service Copyright Protection Authors: Hao Li, Yubing Ren, Yanan Cao, Yingjie Li, Fang Fang, Xuebin Wang | Published: 2025-12-18 著作権保護透かし透かしの耐久性 2025.12.18 文献データベース
Large Language Models as a (Bad) Security Norm in the Context of Regulation and Compliance Authors: Kaspar Rosager Ludvigsen | Published: 2025-12-18 LLM活用インダイレクトプロンプトインジェクション大規模言語モデル 2025.12.18 文献データベース
Agent Tools Orchestration Leaks More: Dataset, Benchmark, and Mitigation Authors: Yuxuan Qiao, Dongqin Liu, Hongchang Yang, Wei Zhou, Songlin Hu | Published: 2025-12-18 データ漏洩プライバシー保護機械学習透かし 2025.12.18 文献データベース
In-Context Probing for Membership Inference in Fine-Tuned Language Models Authors: Zhexi Lu, Hongliang Chi, Nathalie Baracaldo, Swanand Ravindra Kadhe, Yuseok Jeon, Lei Yu | Published: 2025-12-18 AIによる出力のバイアスの検出プライバシー保護機械学習プロンプトリーキング 2025.12.18 文献データベース
Love, Lies, and Language Models: Investigating AI’s Role in Romance-Baiting Scams Authors: Gilad Gressel, Rahul Pankajakshan, Shir Rozenfeld, Ling Li, Ivan Franceschini, Krishnahsree Achuthan, Yisroel Mirsky | Published: 2025-12-18 LLM活用インダイレクトプロンプトインジェクション社会的影響 2025.12.18 文献データベース
DualGuard: Dual-stream Large Language Model Watermarking Defense against Paraphrase and Spoofing Attack Authors: Hao Li, Yubing Ren, Yanan Cao, Yingjie Li, Fang Fang, Shi Wang, Li Guo | Published: 2025-12-18 スプーフィング攻撃分析生成AI向け電子透かし透かしの耐久性 2025.12.18 文献データベース
ContextLeak: Auditing Leakage in Private In-Context Learning Methods Authors: Jacob Choi, Shuying Cao, Xingjian Dong, Wang Bill Zhu, Robin Jia, Sai Praneeth Karimireddy | Published: 2025-12-18 データ漏洩プライバシー保護機械学習プロンプトリーキング 2025.12.18 文献データベース