Prompt, Divide, and Conquer: Bypassing Large Language Model Safety Filters via Segmented and Distributed Prompt Processing

Authors: Johan Wahréus, Ahmed Hussain, Panos Papadimitratos | Published: 2025-03-27

Bayesian Pseudo Posterior Mechanism for Differentially Private Machine Learning

Authors: Robert Chew, Matthew R. Williams, Elan A. Segarra, Alexander J. Preiss, Amanda Konet, Terrance D. Savitsky | Published: 2025-03-27

Tricking Retrievers with Influential Tokens: An Efficient Black-Box Corpus Poisoning Attack

Authors: Cheng Wang, Yiwei Wang, Yujun Cai, Bryan Hooi | Published: 2025-03-27

国際的なAI規制の動向

AI規制を概観するために、本稿では主に国際的なAI規制の議論の状況について解説します。

「AIセキュリティポータル」を公開しました

AIのセキュリティに関する情報をまとめて発信するWebサイト「AIセキュリティポータル」を公開しました。

プロンプトインジェクション

LLMへの代表的な攻撃の一つであるプロンプトインジェクションについて解説します。

AIセキュリティに関する用語集

AIセキュリティに関する用語をまとめて解説します。

AIの悪用

AIの悪用に関して、具体的な事例、その影響、および対策について解説します。

有害な応答

LLMから得られる有害な応答の種類と被害、影響について解説します。

LLMの安全機構

LLMによる不適切な発言を抑制する安全機構について解説します。