攻撃手法 | AIセキュリティポータル

Character-Level Perturbations Disrupt LLM Watermarks

Authors: Zhaoxi Zhang, Xiaomei Zhang, Yanjun Zhang, He Zhang, Shirui Pan, Bo Liu, Asif Qumer Gill, Leo Yu Zhang | Published: 2025-09-11

攻撃手法

生成AI向け電子透かし

透かし設計

2025.09.11

文献データベース

Not All Samples Are Equal: Quantifying Instance-level Difficulty in Targeted Data Poisoning

Authors: William Xu, Yiwei Lu, Yihan Wang, Matthew Y. R. Yang, Zuoqiu Liu, Gautam Kamath, Yaoliang Yu | Published: 2025-09-08

ポイズニング

ポイズニング難易度

攻撃手法

2025.09.08

文献データベース

Imitative Membership Inference Attack

Authors: Yuntao Du, Yuetian Chen, Hanshen Xiao, Bruno Ribeiro, Ninghui Li | Published: 2025-09-08

実験的検証

攻撃手法

敵対的学習

2025.09.08

文献データベース

When LLMs Copy to Think: Uncovering Copy-Guided Attacks in Reasoning LLMs

Authors: Yue Li, Xiao Li, Hao Wu, Yue Zhang, Fengyuan Xu, Xiuzhen Cheng, Sheng Zhong | Published: 2025-07-22

プロンプトリーキング

モデルDoS

攻撃手法

2025.07.22

文献データベース

From Text to Actionable Intelligence: Automating STIX Entity and Relationship Extraction

Authors: Ahmed Lekssays, Husrev Taha Sencar, Ting Yu | Published: 2025-07-22

インダイレクトプロンプトインジェクション

攻撃手法

脅威モデリング

2025.07.22

文献データベース

Depth Gives a False Sense of Privacy: LLM Internal States Inversion

Authors: Tian Dong, Yan Meng, Shaofeng Li, Guoxing Chen, Zhen Liu, Haojin Zhu | Published: 2025-07-22

プロンプトインジェクション

プロンプトリーキング

攻撃手法

2025.07.22

文献データベース

The Hidden Dangers of Browsing AI Agents

Authors: Mykyta Mudryi, Markiyan Chaklosh, Grzegorz Wójcik | Published: 2025-05-19

LLMセキュリティ

インダイレクトプロンプトインジェクション

攻撃手法

2025.05.19

文献データベース

Evaluatiing the efficacy of LLM Safety Solutions : The Palit Benchmark Dataset

Authors: Sayon Palit, Daniel Woods | Published: 2025-05-19

LLMセキュリティ

プロンプトインジェクション

攻撃手法

2025.05.19

文献データベース

From Assistants to Adversaries: Exploring the Security Risks of Mobile LLM Agents

Authors: Liangxuan Wu, Chao Wang, Tianming Liu, Yanjie Zhao, Haoyu Wang | Published: 2025-05-19

LLMセキュリティ

インダイレクトプロンプトインジェクション

攻撃手法

2025.05.19

文献データベース

Revealing Weaknesses in Text Watermarking Through Self-Information Rewrite Attacks

Authors: Yixin Cheng, Hongcheng Guo, Yangming Li, Leonid Sigal | Published: 2025-05-08

プロンプトリーキング

攻撃手法

透かし技術

2025.05.08

文献データベース