AIセキュリティポータルbot

AgentWard: A Lifecycle Security Architecture for Autonomous AI Agents

Authors: Yixiang Zhang, Xinhao Deng, Jiaqing Wu, Yue Xiao, Ke Xu, Qi Li | Published: 2026-04-27
インダイレクトプロンプトインジェクション
リスクシナリオ生成
攻撃チェーン分析

Layerwise Convergence Fingerprints for Runtime Misbehavior Detection in Large Language Models

Authors: Nay Myat Min, Long H. Pham, Jun Sun | Published: 2026-04-27
インダイレクトプロンプトインジェクション
プロンプトインジェクション
一般化性能

GAMMAF: A Common Framework for Graph-Based Anomaly Monitoring Benchmarking in LLM Multi-Agent Systems

Authors: Pablo Mateo-Torrejón, Alfonso Sánchez-Macián | Published: 2026-04-27
LLM性能評価
インダイレクトプロンプトインジェクション
マルチエージェントシステム

A Survey on Split Learning for LLM Fine-Tuning: Models, Systems, and Privacy Optimizations

Authors: Zihan Liu, Yizhen Wang, Rui Wang, Xiu Tang, Sai Wu | Published: 2026-04-27
AIによる出力のバイアスの検出
プライバシー保護手法
連合学習

Defusing the Trigger: Plug-and-Play Defense for Backdoored LLMs via Tail-Risk Intrinsic Geometric Smoothing

Authors: Kaisheng Fan, Weizhe Zhang, Yishu Gao, Tegawendé F. Bissyandé, Xunzhu Tang | Published: 2026-04-27
バックドアモデルの検知
モデル抽出攻撃
攻撃チェーン分析

AgentVisor: Defending LLM Agents Against Prompt Injection via Semantic Virtualization

Authors: Zonghao Ying, Haozheng Wang, Jiangfan Liu, Quanchen Zou, Aishan Liu, Jian Yang, Yaodong Yang, Xianglong Liu | Published: 2026-04-27
LLM性能評価
インダイレクトプロンプトインジェクション
データ保護手法

An Information-Geometric Framework for Stability Analysis of Large Language Models under Entropic Stress

Authors: Hikmat Karimov, Rahid Zahid Alekberli | Published: 2026-04-27
一般化性能
解釈可能性
評価手法

System-aware contextual digital twin for ICS anomaly diagnosis

Authors: Eungyu Woo, Yooshin Kim, Wonje Heo, Donghoon Shin | Published: 2026-04-27
クラス不均衡
解釈可能性

Transient Turn Injection: Exposing Stateless Multi-Turn Vulnerabilities in Large Language Models

Authors: Naheed Rayhan, Sohely Jahan | Published: 2026-04-23
プロンプトインジェクション
安全性評価手法
脆弱性評価手法

Stealthy Backdoor Attacks against LLMs Based on Natural Style Triggers

Authors: Jiali Wei, Ming Fan, Guoheng Sun, Xicheng Zhang, Haijun Wang, Ting Liu | Published: 2026-04-23
インダイレクトプロンプトインジェクション
データ毒性
ポイズニング攻撃