AIセキュリティポータルbot

PRAG End-to-End Privacy-Preserving Retrieval-Augmented Generation

Authors: Zhijun Li, Minghui Xu, Huayi Qi, Wenxuan Yu, Tingchuang Zhang, Qiao Zhang, GuangYong Shang, Zhen Ma, Xiuzhen Cheng | Published: 2026-04-29
RAG
RAGへのポイズニング攻撃
プライバシー保護手法

SafeReview: Defending LLM-based Review Systems Against Adversarial Hidden Prompts

Authors: Yuan Xin, Yixuan Weng, Minjun Zhu, Ying Ling, Chengwei Qin, Michael Hahn, Michael Backes, Yue Zhang, Linyi Yang | Published: 2026-04-29
LLM性能評価
プロンプトインジェクション
プロンプトの検証

Quantamination: Dynamic Quantization Leaks Your Data Across the Batch

Authors: Hanna Foerster, Ilia Shumailov, Cheng Zhang, Yiren Zhao, Jamie Hayes, Robert Mullins | Published: 2026-04-29
プライバシー損失分析
プロンプトリーキング
モデル抽出攻撃の検知

Towards Agentic Investigation of Security Alerts

Authors: Even Eilertsen, Vasileios Mavroeidis, Gudmund Grov | Published: 2026-04-28
LLM性能評価
RAGへのポイズニング攻撃
インダイレクトプロンプトインジェクション

From CRUD to Autonomous Agents: Formal Validation and Zero-Trust Security for Semantic Gateways in AI-Native Enterprise Systems

Authors: Ignacio Peyrano | Published: 2026-04-28
セキュアなロジスティック回帰
動的アクセス制御
脆弱性評価手法

MARD: A Multi-Agent Framework for Robust Android Malware Detection

Authors: Xueying Zeng, Youquan Xian, Sihao Liu, Xudong Mou, Yanze Li, Lei Cui, Bo Li | Published: 2026-04-28
LLM性能評価
インダイレクトプロンプトインジェクション
一般化性能

R-CoT: A Reasoning-Layer Watermark via Redundant Chain-of-Thought in Large Language Models

Authors: Ziming Zhang, Li Li, Guorui Feng, Hanzhou Wu, Xinpeng Zhang | Published: 2026-04-28
プロンプトインジェクション
報酬関数設計
検証可能な資格情報

Making AI-Assisted Grant Evaluation Auditable without Exposing the Model

Authors: Kemal Bicakci | Published: 2026-04-28
リスクシナリオ生成
検証可能な資格情報
評価手法

AgentWard: A Lifecycle Security Architecture for Autonomous AI Agents

Authors: Yixiang Zhang, Xinhao Deng, Jiaqing Wu, Yue Xiao, Ke Xu, Qi Li | Published: 2026-04-27
インダイレクトプロンプトインジェクション
リスクシナリオ生成
攻撃チェーン分析

Layerwise Convergence Fingerprints for Runtime Misbehavior Detection in Large Language Models

Authors: Nay Myat Min, Long H. Pham, Jun Sun | Published: 2026-04-27
インダイレクトプロンプトインジェクション
プロンプトインジェクション
一般化性能