文献データベース

Securing AI Agent Execution

Authors: Christoph Bühler, Matteo Biagiola, Luca Di Grazia, Guido Salvaneschi | Published: 2025-10-24 | Updated: 2025-10-29
インダイレクトプロンプトインジェクション
モデル抽出攻撃
動的アクセス制御

RAGRank: Using PageRank to Counter Poisoning in CTI LLM Pipelines

Authors: Austin Jia, Avaneesh Ramesh, Zain Shamsi, Daniel Zhang, Alex Liu | Published: 2025-10-23
RAG
RAGへのポイズニング攻撃
サイバー脅威インテリジェンス

Learning to Triage Taint Flows Reported by Dynamic Program Analysis in Node.js Packages

Authors: Ronghao Ni, Aidan Z. H. Yang, Min-Chien Hsu, Nuno Sabino, Limin Jia, Ruben Martins, Darion Cassel, Kevin Cheang | Published: 2025-10-23
Node.js脆弱性評価
トレーニング手法
脆弱性検出手法

Black Box Absorption: LLMs Undermining Innovative Ideas

Authors: Wenjun Cao | Published: 2025-10-23
AIシステムの関係性
イノベーション経済学
知的財産保護

AdaDoS: Adaptive DoS Attack via Deep Adversarial Reinforcement Learning in SDN

Authors: Wei Shao, Yuhao Wang, Rongguang He, Muhammad Ejaz Ahmed, Seyit Camtepe | Published: 2025-10-23
DoS対策
ネットワーク脅威検出
モデルDoS

HHEML: Hybrid Homomorphic Encryption for Privacy-Preserving Machine Learning on Edge

Authors: Yu Hin Chan, Hao Yang, Shiyu Shen, Xingyu Fan, Shengzhe Lyu, Patrick S. Y. Hung, Ray C. C. Cheung | Published: 2025-10-23
プライバシー保護機械学習
暗号化アルゴリズム
暗号化技術

Beyond Text: Multimodal Jailbreaking of Vision-Language and Audio Models through Perceptually Simple Transformations

Authors: Divyanshu Kumar, Shreyas Jena, Nitin Aravind Birur, Tanay Baswa, Sahil Agarwal, Prashanth Harshangi | Published: 2025-10-23
モデルの堅牢性
大規模言語モデル
攻撃手法評価

SAID: Empowering Large Language Models with Self-Activating Internal Defense

Authors: Yulong Chen, Yadong Liu, Jiawen Zhang, Mu Li, Chao Huang, Jie Wen | Published: 2025-10-23
プロンプトインジェクション
モデルの堅牢性
大規模言語モデル

LLMs can hide text in other text of the same length

Authors: Antonio Norelli, Michael Bronstein | Published: 2025-10-22 | Updated: 2025-10-27
プライバシー保護
プロンプトの検証
教育目的の情報提供

The Tail Tells All: Estimating Model-Level Membership Inference Vulnerability Without Reference Models

Authors: Euodia Dodd, Nataša Krčo, Igor Shilov, Yves-Alexandre de Montjoye | Published: 2025-10-22
プライバシー保護機械学習
モデルの堅牢性
低コストのメンバシップ推論手法