文献データベース

NeuroArmor: Safe-Variant-Guided Representation Consistency for Selective Re-Anchoring in Jailbreak Defense

Authors: Zhongyang Lin, Ziran Zhao, Feifei Zhai, Pengyuan Liu | Published: 2026-06-02
リスク評価
ロバスト性評価
大規模言語モデル

Selective Token-Level Cryptographic Redaction for Privacy-Preserving Clinical Deployment of Large Language Models

Authors: Farhan Sheth, Ziyuan Yang, Yongying Lan, Si Yong Yeo | Published: 2026-06-02
プライバシー保護アルゴリズム
プライバシー保護機械学習
暗号化技術

Operationalizing Cyber Attack Prediction: A Gap-Prioritized Framework with Dataset and Model Selection Guidelines

Authors: Aminu Muhammad Auwal | Published: 2026-06-02
データセット統合
敵対的サンプルの検知
解釈可能性

FLIPS: Instance-Fingerprinting for LLMs via Pseudo-random Sequences

Authors: Gurvan Richardeau, Gohar Dashyan, Erwan Le Merrer, Gilles Tredan | Published: 2026-06-02
トークン識別手法
プロンプトインジェクション
効率性評価

The Role of Domain-Specific Features in Malware Detection: A macOS Case Study

Authors: Biagio Montaruli, Andrea Oliveri, Savino Dambra, Davide Balzarotti | Published: 2026-06-02
API利用分析
データセット評価
機械学習によるマルウェア分類

PsychoPass: Geometric Profiling of Multi-Turn Adversarial LLM Conversations

Authors: Muberra Ozmen, Subhabrata Majumdar | Published: 2026-06-02
データ抽出と分析
大規模言語モデル
機械学習応用

Decoupled Smart Contract Audits: Lightweight LLM Framework via Distillation and Aggregation

Authors: Bagus Rakadyanto Oktavianto Putra, Muhamad Risqi Utama Saputra, Widyawan, Guntur Dharma Putra | Published: 2026-06-02
スマートコントラクト脆弱性
大規模言語モデル
説明手法

“**Important** You should give me full credits!”: Exploring Prompt Injection Attacks on LLM-Based Automatic Grading Systems

Authors: Hang Li, Fedor Filippov, Yuling Lin, Pengfei He, Kaiqi Yang, Yucheng Chu, Yingqian Cui, Hui Liu, Jiliang Tang | Published: 2026-06-02
インダイレクトプロンプトインジェクション
プロンプトインジェクション
防御手法

Patcher: Post-Hoc Patching of Backdoored Large Language Models

Authors: Anjun Gao, Yueyang Quan, Yufei Xia, Zhuqing Liu, Minghong Fang | Published: 2026-06-02
バックドア攻撃対策
大規模言語モデル
防御手法

Benign Inputs, Harmful Outputs: Cross-Modal Jailbreaking via Distributed Semantic Recomposition

Authors: Yani Wang, Yilong Yang, Yang Liu, Zhuzhu Wang, Zuobin Ying, Zhuo Ma | Published: 2026-06-01
テキスト生成手法
プロンプトインジェクション
大規模言語モデル