リスク評価手法

GuardTrace-VL: Detecting Unsafe Multimodel Reasoning via Iterative Safety Supervision

Authors: Yuxiao Xiang, Junchi Chen, Zhenchao Jin, Changtao Miao, Haojie Yuan, Qi Chu, Tao Gong, Nenghai Yu | Published: 2025-11-26

プロンプトインジェクション

リスク評価手法

倫理的考慮

2025.11.26

文献データベース

Can LLMs Threaten Human Survival? Benchmarking Potential Existential Threats from LLMs via Prefix Completion

Authors: Yu Cui, Yifei Liu, Hang Fu, Sicheng Pan, Haibin Zhang, Cong Zuo, Licheng Wang | Published: 2025-11-24

インダイレクトプロンプトインジェクション

プロンプトインジェクション

リスク評価手法

2025.11.24

文献データベース

LLM-CSEC: Empirical Evaluation of Security in C/C++ Code Generated by Large Language Models

Authors: Muhammad Usman Shahid, Chuadhry Mujeeb Ahmed, Rajiv Ranjan | Published: 2025-11-24

サイバーセキュリティの自動化

プロンプトリーキング

リスク評価手法

2025.11.24

文献データベース

DeepTx: Real-Time Transaction Risk Analysis via Multi-Modal Features and LLM Reasoning

Authors: Yixuan Liu, Xinlei Li, Yi Li | Published: 2025-10-21

UI分析

リスク評価手法

悪意のあるウェブサイト検出

2025.10.21

文献データベース

AI Risk-Management Standards Profile for General-Purpose AI (GPAI) and Foundation Models

Authors: Anthony M. Barrett, Jessica Newman, Brandie Nonnecke, Nada Madkour, Dan Hendrycks, Evan R. Murphy, Krystal Jackson, Deepika Raman | Published: 2025-06-30

モデルインバージョン

リスク評価手法

教育やフォローアップ

2025.06.30

文献データベース

LibVulnWatch: A Deep Assessment Agent System and Leaderboard for Uncovering Hidden Vulnerabilities in Open-Source AI Libraries

Authors: Zekun Wu, Seonglae Cho, Umar Mohammed, Cristian Munoz, Kleyton Costa, Xin Guan, Theo King, Ze Wang, Emre Kazim, Adriano Koshiyama | Published: 2025-05-13 | Updated: 2025-06-30

インダイレクトプロンプトインジェクション

リスク評価手法

依存関係管理

2025.05.13

文献データベース

Score Attack: A Lower Bound Technique for Optimal Differentially Private Learning

Authors: T. Tony Cai, Yichen Wang, Linjun Zhang | Published: 2023-03-13

プライバシー保護技術

リスク評価手法

収束特性

2023.03.13 2025.04.03

文献データベース

Common Vulnerability Scoring System Prediction based on Open Source Intelligence Information Sources

Authors: Philipp Kuehn, David N. Relke, Christian Reuter | Published: 2022-10-05

データの起源と変遷

データ保護手法

リスク評価手法

2022.10.05 2025.04.03

文献データベース

Wild Networks: Exposure of 5G Network Infrastructures to Adversarial Examples

Authors: Giovanni Apruzzese, Rodion Vladimirov, Aliya Tastemirova, Pavel Laskov | Published: 2022-07-04

ネットワークスライシング

リスク評価手法

敵対的学習

2022.07.04 2025.04.03

文献データベース

Privacy-Preserving Reinforcement Learning Beyond Expectation

Authors: Arezoo Rajabi, Bhaskar Ramasubramanian, Abdullah Al Maruf, Radha Poovendran | Published: 2022-03-18

プライバシー評価

リスク評価手法

強化学習アルゴリズム

2022.03.18 2025.04.03

文献データベース