NeuroArmor: Safe-Variant-Guided Representation Consistency for Selective Re-Anchoring in Jailbreak Defense Authors: Zhongyang Lin, Ziran Zhao, Feifei Zhai, Pengyuan Liu | Published: 2026-06-02 リスク評価ロバスト性評価大規模言語モデル 2026.06.02 文献データベース
Selective Token-Level Cryptographic Redaction for Privacy-Preserving Clinical Deployment of Large Language Models Authors: Farhan Sheth, Ziyuan Yang, Yongying Lan, Si Yong Yeo | Published: 2026-06-02 プライバシー保護アルゴリズムプライバシー保護機械学習暗号化技術 2026.06.02 文献データベース
Operationalizing Cyber Attack Prediction: A Gap-Prioritized Framework with Dataset and Model Selection Guidelines Authors: Aminu Muhammad Auwal | Published: 2026-06-02 データセット統合敵対的サンプルの検知解釈可能性 2026.06.02 文献データベース
FLIPS: Instance-Fingerprinting for LLMs via Pseudo-random Sequences Authors: Gurvan Richardeau, Gohar Dashyan, Erwan Le Merrer, Gilles Tredan | Published: 2026-06-02 トークン識別手法プロンプトインジェクション効率性評価 2026.06.02 文献データベース
The Role of Domain-Specific Features in Malware Detection: A macOS Case Study Authors: Biagio Montaruli, Andrea Oliveri, Savino Dambra, Davide Balzarotti | Published: 2026-06-02 API利用分析データセット評価機械学習によるマルウェア分類 2026.06.02 文献データベース
PsychoPass: Geometric Profiling of Multi-Turn Adversarial LLM Conversations Authors: Muberra Ozmen, Subhabrata Majumdar | Published: 2026-06-02 データ抽出と分析大規模言語モデル機械学習応用 2026.06.02 文献データベース
Decoupled Smart Contract Audits: Lightweight LLM Framework via Distillation and Aggregation Authors: Bagus Rakadyanto Oktavianto Putra, Muhamad Risqi Utama Saputra, Widyawan, Guntur Dharma Putra | Published: 2026-06-02 スマートコントラクト脆弱性大規模言語モデル説明手法 2026.06.02 文献データベース
“**Important** You should give me full credits!”: Exploring Prompt Injection Attacks on LLM-Based Automatic Grading Systems Authors: Hang Li, Fedor Filippov, Yuling Lin, Pengfei He, Kaiqi Yang, Yucheng Chu, Yingqian Cui, Hui Liu, Jiliang Tang | Published: 2026-06-02 インダイレクトプロンプトインジェクションプロンプトインジェクション防御手法 2026.06.02 文献データベース
Patcher: Post-Hoc Patching of Backdoored Large Language Models Authors: Anjun Gao, Yueyang Quan, Yufei Xia, Zhuqing Liu, Minghong Fang | Published: 2026-06-02 バックドア攻撃対策大規模言語モデル防御手法 2026.06.02 文献データベース
Benign Inputs, Harmful Outputs: Cross-Modal Jailbreaking via Distributed Semantic Recomposition Authors: Yani Wang, Yilong Yang, Yang Liu, Zhuzhu Wang, Zuobin Ying, Zhuo Ma | Published: 2026-06-01 テキスト生成手法プロンプトインジェクション大規模言語モデル 2026.06.01 文献データベース