透かし技術の堅牢性

DNF: Dual-Layer Nested Fingerprinting for Large Language Model Intellectual Property Protection

Authors: Zhenhua Xu, Yiran Zhao, Mengting Zhong, Dezhang Kong, Changting Lin, Tong Qiao, Meng Han | Published: 2026-01-13

フィンガープリンティング手法

プライバシー保護

透かし技術の堅牢性

2026.01.13

文献データベース

Position: LLM Watermarking Should Align Stakeholders’ Incentives for Practical Adoption

Authors: Yepeng Liu, Xuandong Zhao, Dawn Song, Gregory W. Wornell, Yuheng Bu | Published: 2025-10-21

インセンティブメカニズム

生成AI向け電子透かし

透かし技術の堅牢性

2025.10.21

文献データベース

PMark: Towards Robust and Distortion-free Semantic-level Watermarking with Channel Constraints

Authors: Jiahao Huo, Shuliang Liu, Bin Wang, Junyan Zhang, Yibo Yan, Aiwei Liu, Xuming Hu, Mingxun Zhou | Published: 2025-09-25

アルゴリズム

生成AI向け電子透かし

透かし技術の堅牢性

2025.09.25

文献データベース

Fine-Grained Privacy Extraction from Retrieval-Augmented Generation Systems via Knowledge Asymmetry Exploitation

Authors: Yufei Chen, Yao Wang, Haibin Zhang, Tao Gu | Published: 2025-07-31

RAGへのポイズニング攻撃

プライバシー評価

透かし技術の堅牢性

2025.07.31

文献データベース

Empirical Evaluation of Concept Drift in ML-Based Android Malware Detection

Authors: Ahmed Sabbah, Radi Jarrar, Samer Zein, David Mohaisen | Published: 2025-07-30

ドリフト検出手法

バックドアモデルの検知

透かし技術の堅牢性

2025.07.30

文献データベース

Breaking Obfuscation: Cluster-Aware Graph with LLM-Aided Recovery for Malicious JavaScript Detection

Authors: Zhihong Liang, Xin Wang, Zhenhuang Hu, Liangliang Song, Lin Chen, Jingjing Guo, Yanbin Wang, Ye Tian | Published: 2025-07-30

プログラムの検証

プロンプトインジェクション

透かし技術の堅牢性

2025.07.30

文献データベース

SAEL: Leveraging Large Language Models with Adaptive Mixture-of-Experts for Smart Contract Vulnerability Detection

Authors: Lei Yu, Shiqi Cheng, Zhirong Huang, Jingyuan Zhang, Chenjie Shen, Junyi Lu, Li Yang, Fengjun Zhang, Jiajia Ma | Published: 2025-07-30

プロンプトリーキング

脆弱性検出

透かし技術の堅牢性

2025.07.30

文献データベース

Enhancing Watermarking Quality for LLMs via Contextual Generation States Awareness

Authors: Peiru Yang, Xintian Li, Wanchun Ni, Jinhua Yin, Huili Wang, Guoshun Nan, Shangguang Wang, Yongfeng Huang, Tao Qi | Published: 2025-06-09

情報理論的アプローチ

生成AI向け電子透かし

透かし技術の堅牢性

2025.06.09

文献データベース

CEE: An Inference-Time Jailbreak Defense for Embodied Intelligence via Subspace Concept Rotation

Authors: Jirui Yang, Zheyu Lin, Zhihui Lu, Yinggui Wang, Lei Wang, Tao Wei, Xin Du, Shuhan Yang | Published: 2025-04-15 | Updated: 2025-07-31

プロンプトインジェクション

透かし技術の堅牢性

防御効果分析

2025.04.15

文献データベース

Probabilistic Modeling of Jailbreak on Multimodal LLMs: From Quantification to Application

Authors: Wenzhuo Xu, Zhipeng Wei, Xiongtao Sun, Zonghao Ying, Deyue Zhang, Dongdong Yang, Xiangzheng Zhang, Quanchen Zou | Published: 2025-03-10 | Updated: 2025-07-31

プロンプトインジェクション

大規模言語モデル

透かし技術の堅牢性

2025.03.10

文献データベース