AIセキュリティポータル編集部 | ページ 2

LLMによる有害な応答を防ぐ、安全機構

はじめに本記事は、大規模言語モデル（Large Language Model、LLM）の安全機構について解説します。LLMはChatGPTなどのような生成AIサービスに利用されており、膨大な知識を有していますが、中には有害な内容も学習してい...

2025.06.18

一般読者向け解説記事

はじめに本記事は、AIに対するポイズニング攻撃の一種であるバックドア攻撃について解説します。特に、あるデータに対してラベルの予測を行う分類モデルに対するバックドア攻撃について整理しています。本記事を読むことで、分類モデルに対するバックドア攻...

2025.06.04 2026.05.12

一般読者向け解説記事

はじめに本記事は、ディープフェイクについて解説します。本記事を読むことで、ディープフェイクの原理やそのディープフェイクにより生成された偽コンテンツの検知について理解を深めることができます。※このテーマに関するより専門的な技術解説についてご興...

2025.05.21 2026.05.22

一般読者向け解説記事

はじめに敵対的サンプルとは、AIに誤った出力を引き起こすよう細工された入力データのことです。例えば、標識を認識する画像認識AIに対して、「一時停止」の標識を正しく認識するのを妨げるために、わずかなノイズを加えた画像が挙げられます。こうした画...

2025.05.07

専門家向け解説記事

はじめに本記事は、AIに対するポイズニング攻撃の一種であるバックドア攻撃について解説します。特に、分類モデルに対するバックドア攻撃について整理しています。本記事を読むことで、分類モデルに対するバックドア攻撃の概要や研究の最新動向、課題や今後...

2025.04.16 2026.04.21

専門家向け解説記事

はじめに本記事は、ディープフェイクについて解説します。本記事を読むことで、ディープフェイクやその対策の最新の動向、今後の方向性について理解を深めることができます。※このテーマにご興味のある方は、一般読者向けに書かれた「あなたは騙されない？デ...

2025.04.02 2026.04.21

専門家向け解説記事

はじめにAI規制を概観するために、本稿では主に国際的なAI規制の議論の状況について解説します。AI規制については日本も含めて数多くの国で検討されています。一方で、AIが利用される範囲から、一国で規制が完結する領域ではないため、国際的な議論に...

2025.03.26

一般読者向け解説記事

はじめに本記事は、ChatGPTなどのような生成AIサービスに利用されている大規模言語モデル（Large Language Model, LLM）への代表的な攻撃手法である、プロンプトインジェクションについて解説します。近年、さまざまな場面...

2025.03.26 2026.04.21

一般読者向け解説記事

はじめに「AI」は私たちの身の回りにも浸透してきています。例えば、手元のスマートフォンのカメラで何かを撮影しようとすると、AIが風景や被写体を自動的に判定し、明るさなどを調整してくれます。このように、AIは私たちの生活を豊かにしてくれる一方...

2025.03.26 2026.04.21

一般読者向け解説記事

はじめに本記事では、AIの悪用について解説します。AIは我々の生活を豊かにするだけでなく、悪用されることで我々の生活を脅かすものになり得ます。本記事を読むことで、AIの悪用の事例やその影響、対策について理解を深めることができます。AIの悪用...

2025.03.26 2026.04.21

一般読者向け解説記事