AIセキュリティポータルbot | ページ 97 | AIセキュリティポータル

R1dacted: Investigating Local Censorship in DeepSeek’s R1 Language Model

Authors: Ali Naseh, Harsh Chaudhari, Jaechul Roh, Mingshi Wu, Alina Oprea, Amir Houmansadr | Published: 2025-05-19

AIによる出力のバイアスの検出

プロンプトリーキング

検閲行動

2025.05.19

文献データベース

Improving LLM Outputs Against Jailbreak Attacks with Expert Model Integration

Authors: Tatia Tsmindashvili, Ana Kolkhidashvili, Dachi Kurtskhalia, Nino Maghlakelidze, Elene Mekvabishvili, Guram Dentoshvili, Orkhan Shamilov, Zaal Gachechiladze, Steven Saporta, David Dachi Choladze | Published: 2025-05-18 | Updated: 2025-08-11

プロンプトインジェクション

大規模言語モデル

性能評価手法

2025.05.18

文献データベース

IP Leakage Attacks Targeting LLM-Based Multi-Agent Systems

Authors: Liwen Wang, Wenxuan Wang, Shuai Wang, Zongjie Li, Zhenlan Ji, Zongyi Lyu, Daoyuan Wu, Shing-Chi Cheung | Published: 2025-05-18 | Updated: 2025-05-20

インダイレクトプロンプトインジェクション

プライバシー漏洩

情報伝播手法

2025.05.18

文献データベース

MARVEL: Multi-Agent RTL Vulnerability Extraction using Large Language Models

Authors: Luca Collini, Baleegh Ahmad, Joey Ah-kiow, Ramesh Karri | Published: 2025-05-17 | Updated: 2025-06-09

RAGへのポイズニング攻撃

サイバー脅威

プロンプトインジェクション

2025.05.17

文献データベース

JULI: Jailbreak Large Language Models by Self-Introspection

Authors: Jesson Wang, Zhanhao Hu, David Wagner | Published: 2025-05-17 | Updated: 2025-05-20

APIセキュリティ

LLMの安全機構の解除

プロンプトインジェクション

2025.05.17

文献データベース

Phare: A Safety Probe for Large Language Models

Authors: Pierre Le Jeune, Benoît Malézieux, Weixuan Xiao, Matteo Dora | Published: 2025-05-16 | Updated: 2025-05-19

RAG

バイアス緩和手法

ハルシネーション

2025.05.16

文献データベース

S3C2 Summit 2024-09: Industry Secure Software Supply Chain Summit

Authors: Imranur Rahman, Yasemin Acar, Michel Cukier, William Enck, Christian Kastner, Alexandros Kapravelos, Dominik Wermke, Laurie Williams | Published: 2025-05-15

LLMセキュリティ

ソフトウェア供給チェーンセキュリティ

教育と自動化のバランス

2025.05.15

文献データベース

Quantized Approximate Signal Processing (QASP): Towards Homomorphic Encryption for audio

Authors: Tu Duyen Nguyen, Adrien Lesage, Clotilde Cantini, Rachid Riad | Published: 2025-05-15

量子化ニューラルネットワーク

音声データ処理システム

音声認識システム

2025.05.15

文献データベース

AutoPentest: Enhancing Vulnerability Management With Autonomous LLM Agents

Authors: Julius Henke | Published: 2025-05-15

LLMセキュリティ

RAG

インダイレクトプロンプトインジェクション

2025.05.15

文献データベース

Private Transformer Inference in MLaaS: A Survey

Authors: Yang Li, Xinyu Zhou, Yitong Wang, Liangxin Qian, Jun Zhao | Published: 2025-05-15

暗号化技術

機械学習

計算の整合性

2025.05.15

文献データベース