ページ 6 | AIセキュリティポータル

PI-Hunter: Automated Red-Teaming for Exposing and Localizing Prompt Injections

Authors: Pengfei He, Lesly Miculicich, Vishesh Sharma, Ash Fox, George Lee, Jiliang Tang, Tomas Pfister, Long T. Le | Published: 2026-06-10

2026.06.10

文献データベース

OCELOT: Inference-Leakage Budgets for Privacy-Preserving LLM Agents

Authors: Jin Xie, Songze Li | Published: 2026-06-10

2026.06.10

文献データベース

Mind your key: An Empirical Study of LLM API Credential Leakage in iOS Apps

Authors: Pinran Gao, Lingxiang Wang, Ying Zhang, Fan Yang | Published: 2026-06-10

2026.06.10

文献データベース

Categorical Robustness Assessment for Machine Learning based Network Intrusion Detection Systems

Authors: Mayank Raj, Nathaniel D. Bastian, Lance Fiondella, Gokhan Kul | Published: 2026-06-10

2026.06.10

文献データベース

AIエージェント特有の脅威

AI技術の発展に伴い、人間に変わって特定のタスクを自律的に行うAIエージェントを用いたシステム（AIエージェントシステム）の利活用が期待されています。大規模言語モデル（Large Language Model、 LLM）を中核に、Chain-of-Thought、メモリ（短期・長期記憶）、LLM単体では実現できない機能を提供するツールといった要素技術を組み合わせたAIエージェントシステムは、その自律性と能力の高さから、様々なタスクの遂行が可能です。一方で、AIエージェントシステムは、従来型のアプリケーションとは異なる、

2026.06.10

専門家向け解説記事

Online Shift Detection and Conformal Adaptation for Deployed Safety Classifiers

Authors: Jun Wen Leong | Published: 2026-06-10

2026.06.10

文献データベース

Grammar-Constrained Decoding Can Jailbreak LLMs into Generating Malicious Code

Authors: Yitong Zhang, Shiteng Lu, Jia Li | Published: 2026-06-10

2026.06.10

文献データベース

Can Open-Source LLM Agents Replace Static Application Security Testing Tools? An Empirical Assessment

Authors: Derek Yohn, Luke Flancher, Mirajul Islam, Khaled Slhoub | Published: 2026-06-10

2026.06.10

文献データベース

Dummy Backdoor as a Defense: Removing Unknown Backdoors via Shared Internal Mechanisms for Generative LLMs

Authors: Kazuki Iwahana, Masaru Matsubayashi, Takuma Koyama, Toshiki Shibahara, Kenichiro Omintato, Akira Ito | Published: 2026-06-10

2026.06.10

文献データベース

Defense Against Prompt Inversion Attacks: An Information-Theoretic Approach for LLM Collaborative Inference

Authors: Sayedeh Leila Noorbakhsh, Hossein Khalili, Nader Sehatbakhsh | Published: 2026-06-10

2026.06.10

文献データベース