文献データベース

文献データベースでは、AIセキュリティに関する文献情報を分類・集約しています。詳しくは文献データベースについてをご覧ください。統計情報のページでは、収集された文献に関する統計情報を公開しています。
The Literature Database categorizes and aggregates literature related to AI security. For more details, please see About Literature Database. We provide statistical information regarding the Literature Database on the Statistics page.

Phishing Detection System: An Ensemble Approach Using Character-Level CNN and Feature Engineering

Authors: Rudra Dubey, Arpit Mani Tripathi, Archit Srivastava, Sarvpal Singh | Published: 2025-12-18
アンサンブル学習
次世代フィッシング検出
特徴抽出

Prefix Probing: Lightweight Harmful Content Detection for Large Language Models

Authors: Jirui Yang, Hengqi Guo, Zhihui Lu, Yi Zhao, Yuansen Zhang, Shijing Hu, Qiang Duan, Yinggui Wang, Tao Wei | Published: 2025-12-18
トークン分布分析
プロンプトインジェクション
プロンプトリーキング

A Systematic Study of Code Obfuscation Against LLM-based Vulnerability Detection

Authors: Xiao Li, Yue Li, Hao Wu, Yue Zhang, Yechao Zhang, Fengyuan Xu, Sheng Zhong | Published: 2025-12-18
インダイレクトプロンプトインジェクション
プロンプトインジェクション
難読化手法

From Essence to Defense: Adaptive Semantic-aware Watermarking for Embedding-as-a-Service Copyright Protection

Authors: Hao Li, Yubing Ren, Yanan Cao, Yingjie Li, Fang Fang, Xuebin Wang | Published: 2025-12-18
著作権保護
透かし
透かしの耐久性

Large Language Models as a (Bad) Security Norm in the Context of Regulation and Compliance

Authors: Kaspar Rosager Ludvigsen | Published: 2025-12-18
LLM活用
インダイレクトプロンプトインジェクション
大規模言語モデル

Agent Tools Orchestration Leaks More: Dataset, Benchmark, and Mitigation

Authors: Yuxuan Qiao, Dongqin Liu, Hongchang Yang, Wei Zhou, Songlin Hu | Published: 2025-12-18
データ漏洩
プライバシー保護機械学習
透かし

In-Context Probing for Membership Inference in Fine-Tuned Language Models

Authors: Zhexi Lu, Hongliang Chi, Nathalie Baracaldo, Swanand Ravindra Kadhe, Yuseok Jeon, Lei Yu | Published: 2025-12-18
AIによる出力のバイアスの検出
プライバシー保護機械学習
プロンプトリーキング

Love, Lies, and Language Models: Investigating AI’s Role in Romance-Baiting Scams

Authors: Gilad Gressel, Rahul Pankajakshan, Shir Rozenfeld, Ling Li, Ivan Franceschini, Krishnahsree Achuthan, Yisroel Mirsky | Published: 2025-12-18
LLM活用
インダイレクトプロンプトインジェクション
社会的影響

DualGuard: Dual-stream Large Language Model Watermarking Defense against Paraphrase and Spoofing Attack

Authors: Hao Li, Yubing Ren, Yanan Cao, Yingjie Li, Fang Fang, Shi Wang, Li Guo | Published: 2025-12-18
スプーフィング攻撃分析
生成AI向け電子透かし
透かしの耐久性

ContextLeak: Auditing Leakage in Private In-Context Learning Methods

Authors: Jacob Choi, Shuying Cao, Xingjian Dong, Wang Bill Zhu, Robin Jia, Sai Praneeth Karimireddy | Published: 2025-12-18
データ漏洩
プライバシー保護機械学習
プロンプトリーキング