AIセキュリティポータルbot | ページ 110 | AIセキュリティポータル

Benchmarking Practices in LLM-driven Offensive Security: Testbeds, Metrics, and Experiment Design

Authors: Andreas Happe, Jürgen Cito | Published: 2025-04-14

テストベッド

プロンプトの検証

進捗追跡

2025.04.14

文献データベース

Do We Really Need Curated Malicious Data for Safety Alignment in Multi-modal Large Language Models?

Authors: Yanbo Wang, Jiyang Guan, Jian Liang, Ran He | Published: 2025-04-14

プロンプトインジェクション

学習データの偏り

安全性アライメント

2025.04.14

文献データベース

StruPhantom: Evolutionary Injection Attacks on Black-Box Tabular Agents Powered by Large Language Models

Authors: Yang Feng, Xudong Pan | Published: 2025-04-14

LLM性能評価

インダイレクトプロンプトインジェクション

悪意のあるウェブサイト検出

2025.04.14

文献データベース

An Investigation of Large Language Models and Their Vulnerabilities in Spam Detection

Authors: Qiyao Tang, Xiangyang Li | Published: 2025-04-14

LLM性能評価

プロンプトインジェクション

モデルDoS

2025.04.14

文献データベース

ControlNET: A Firewall for RAG-based LLM System

Authors: Hongwei Yao, Haoran Shi, Yidou Chen, Yixin Jiang, Cong Wang, Zhan Qin | Published: 2025-04-13 | Updated: 2025-04-17

RAGへのポイズニング攻撃

インダイレクトプロンプトインジェクション

データ侵害リスク

2025.04.13

文献データベース

CheatAgent: Attacking LLM-Empowered Recommender Systems via LLM Agent

Authors: Liang-bo Ning, Shijie Wang, Wenqi Fan, Qing Li, Xin Xu, Hao Chen, Feiran Huang | Published: 2025-04-13 | Updated: 2025-04-24

インダイレクトプロンプトインジェクション

プロンプトインジェクション

攻撃者の行動分析

2025.04.13

文献データベース

Detecting Instruction Fine-tuning Attacks on Language Models using Influence Function

Authors: Jiawei Li | Published: 2025-04-12 | Updated: 2025-09-30

バックドア攻撃

プロンプトの検証

感情分析

2025.04.12

文献データベース

On the Practice of Deep Hierarchical Ensemble Network for Ad Conversion Rate Prediction

Authors: Jinfeng Zhuang, Yinrui Li, Runze Su, Ke Xu, Zhixuan Shao, Kungang Li, Ling Leng, Han Sun, Meng Qi, Yixiong Meng, Yang Tang, Zhifang Liu, Qifei Shen, Aayush Mudgal, Caleb Lu, Jie Liu, Hongda Shen | Published: 2025-04-10 | Updated: 2025-04-23

ユーザー体験評価

学習の改善

機械学習の応用

2025.04.10

文献データベース

PR-Attack: Coordinated Prompt-RAG Attacks on Retrieval-Augmented Generation in Large Language Models via Bilevel Optimization

Authors: Yang Jiao, Xiaodong Wang, Kai Yang | Published: 2025-04-10

LLM性能評価

RAGへのポイズニング攻撃

敵対的攻撃評価

2025.04.10

文献データベース

LLM-IFT: LLM-Powered Information Flow Tracking for Secure Hardware

Authors: Nowfel Mashnoor, Mohammad Akyash, Hadi Kamali, Kimia Azar | Published: 2025-04-09

LLMの安全機構の解除

フレームワーク

効率的な構成検証

2025.04.09

文献データベース