AIセキュリティポータルbot | ページ 18 | AIセキュリティポータル

NeuroFilter: Privacy Guardrails for Conversational LLM Agents

Authors: Saswat Das, Ferdinando Fioretto | Published: 2026-01-21

プライバシー保護

プロンプトインジェクション

マルチターン攻撃分析

2026.01.21

文献データベース

An LLM Agent-based Framework for Whaling Countermeasures

Authors: Daisuke Miyamoto, Takuji Iimura, Narushige Michishita | Published: 2026-01-21

インダイレクトプロンプトインジェクション

メールセキュリティ

リスクシナリオ生成

2026.01.21

文献データベース

Constructing Multi-label Hierarchical Classification Models for MITRE ATT&CK Text Tagging

Authors: Andrew Crossman, Jonah Dodd, Viralam Ramamurthy Chaithanya Kumar, Riyaz Mohammed, Andrew R. Plummer, Chandra Sekharudu, Deepak Warrier, Mohammad Yekrangian | Published: 2026-01-21

脅威アクター支援

透かし技術

階層的分類手法

2026.01.21

文献データベース

An Empirical Study on Remote Code Execution in Machine Learning Model Hosting Ecosystems

Authors: Mohammed Latif Siddiq, Tanzim Hossain Romel, Natalie Sekerak, Beatrice Casey, Joanna C. S. Santos | Published: 2026-01-20

セキュリティ保証

データ駆動型脆弱性評価

モデル抽出攻撃

2026.01.20

文献データベース

PAC-Private Responses with Adversarial Composition

Authors: Xiaochen Zhu, Mayuri Sridhar, Srinivas Devadas | Published: 2026-01-20

トリガーの検知

プライバシー保護

差分プライバシー

2026.01.20

文献データベース

VirtualCrime: Evaluating Criminal Potential of Large Language Models via Sandbox Simulation

Authors: Yilin Tang, Yu Wang, Lanlan Qiu, Wenchang Gao, Yunfei Ma, Baicheng Chen, Tianxing He | Published: 2026-01-20

インダイレクトプロンプトインジェクション

リスク評価

犯罪シミュレーション

2026.01.20

文献データベース

HardSecBench: Benchmarking the Security Awareness of LLMs for Hardware Code Generation

Authors: Qirui Chen, Jingxian Shuai, Shuangwu Chen, Shenghao Ye, Zijian Wen, Xufei Su, Jie Jin, Jiangming Li, Jun Chen, Xiaobin Tan, Jian Yang | Published: 2026-01-20

コード生成手法

セキュリティ保証

プロンプトリーキング

2026.01.20

文献データベース

PINA: Prompt Injection Attack against Navigation Agents

Authors: Jiani Liu, Yixin He, Lanlan Fan, Qidi Zhong, Yushi Cheng, Meng Zhang, Yanjiao Chen, Wenyuan Xu | Published: 2026-01-20

インダイレクトプロンプトインジェクション

性能評価

敵対的攻撃

2026.01.20

文献データベース

Automatic Adjustment of HPA Parameters and Attack Prevention in Kubernetes Using Random Forests

Authors: Hanlin Zhou, Huah Yong Chan, Jingfei Ni, Mengchun Wu, Qing Deng | Published: 2026-01-20

性能評価

攻撃トラフィック管理

機械学習応用

2026.01.20

文献データベース

Be Your Own Red Teamer: Safety Alignment via Self-Play and Reflective Experience Replay

Authors: Hao Wang, Yanting Wang, Hao Li, Rui Li, Lei Sha | Published: 2026-01-15

プロンプトインジェクション

敵対的攻撃分析

自己学習手法

2026.01.15

文献データベース