AIセキュリティポータルbot | ページ 197 | AIセキュリティポータル

Rethinking How to Evaluate Language Model Jailbreak

Authors: Hongyu Cai, Arjun Arunasalam, Leo Y. Lin, Antonio Bianchi, Z. Berkay Celik | Published: 2024-04-09 | Updated: 2024-05-07

プロンプトインジェクション

悪意のある行為者の分類

評価手法

2024.04.09 2025.04.03

文献データベース

Aggressive or Imperceptible, or Both: Network Pruning Assisted Hybrid Byzantines in Federated Learning

Authors: Emre Ozfatura, Kerem Ozfatura, Alptekin Kupcu, Deniz Gunduz | Published: 2024-04-09

ポイズニング

攻撃手法

防御手法

2024.04.09 2025.04.03

文献データベース

FuSeBMC AI: Acceleration of Hybrid Approach through Machine Learning

Authors: Kaled M. Alshmrany, Mohannad Aldughaim, Chenfeng Wei, Tom Sweet, Richard Allmendinger, Lucas C. Cordeiro | Published: 2024-04-09

テスト優先順位付け

プログラム解析

リソース最適化

2024.04.09 2025.04.03

文献データベース

Case Study: Neural Network Malware Detection Verification for Feature and Image Datasets

Authors: Preston K. Robinette, Diego Manzanas Lopez, Serena Serbinowska, Kevin Leach, Taylor T. Johnson | Published: 2024-04-08

ウォーターマーキング

マルウェア分類

評価手法

2024.04.08 2025.04.03

文献データベース

BruSLeAttack: A Query-Efficient Score-Based Black-Box Sparse Adversarial Attack

Authors: Viet Quoc Vo, Ehsan Abbasnejad, Damith C. Ranasinghe | Published: 2024-04-08 | Updated: 2024-06-01

ウォーターマーキング

攻撃手法

敵対的サンプル

2024.04.08 2025.04.03

文献データベース

Unbridled Icarus: A Survey of the Potential Perils of Image Inputs in Multimodal Large Language Model Security

Authors: Yihe Fan, Yuxin Cao, Ziyu Zhao, Ziyao Liu, Shaofeng Li | Published: 2024-04-08 | Updated: 2024-08-11

LLMセキュリティ

プロンプトインジェクション

脅威モデリング

2024.04.08 2025.04.03

文献データベース

Enabling Privacy-Preserving Cyber Threat Detection with Federated Learning

Authors: Yu Bi, Yekai Li, Xuan Feng, Xianghang Mi | Published: 2024-04-08

スパム検出

ポイズニング

連合学習

2024.04.08 2025.04.03

文献データベース

Initial Exploration of Zero-Shot Privacy Utility Tradeoffs in Tabular Data Using GPT-4

Authors: Bishwas Mandal, George Amariucai, Shuangqing Wei | Published: 2024-04-07

データプライバシー評価

プライバシー保護手法

プロンプトインジェクション

2024.04.07 2025.04.03

文献データベース

Contextual Chart Generation for Cyber Deception

Authors: David D. Nguyen, David Liebowitz, Surya Nepal, Salil S. Kanhere, Sharif Abuadbba | Published: 2024-04-07

データ前処理

モデル設計

評価手法

2024.04.07 2025.04.03

文献データベース

PoLLMgraph: Unraveling Hallucinations in Large Language Models via State Transition Dynamics

Authors: Derui Zhu, Dingfan Chen, Qing Li, Zongxiong Chen, Lei Ma, Jens Grossklags, Mario Fritz | Published: 2024-04-06

LLMセキュリティ

LLM性能評価

評価手法

2024.04.06 2025.04.03

文献データベース