ページ 10 | AIセキュリティポータル

NeuroArmor: Safe-Variant-Guided Representation Consistency for Selective Re-Anchoring in Jailbreak Defense

Authors: Zhongyang Lin, Ziran Zhao, Feifei Zhai, Pengyuan Liu | Published: 2026-06-02

2026.06.02

文献データベース

Selective Token-Level Cryptographic Redaction for Privacy-Preserving Clinical Deployment of Large Language Models

Authors: Farhan Sheth, Ziyuan Yang, Yongying Lan, Si Yong Yeo | Published: 2026-06-02

2026.06.02

文献データベース

Operationalizing Cyber Attack Prediction: A Gap-Prioritized Framework with Dataset and Model Selection Guidelines

Authors: Aminu Muhammad Auwal | Published: 2026-06-02

2026.06.02

文献データベース

FLIPS: Instance-Fingerprinting for LLMs via Pseudo-random Sequences

Authors: Gurvan Richardeau, Gohar Dashyan, Erwan Le Merrer, Gilles Tredan | Published: 2026-06-02

2026.06.02

文献データベース

The Role of Domain-Specific Features in Malware Detection: A macOS Case Study

Authors: Biagio Montaruli, Andrea Oliveri, Savino Dambra, Davide Balzarotti | Published: 2026-06-02

2026.06.02

文献データベース

PsychoPass: Geometric Profiling of Multi-Turn Adversarial LLM Conversations

Authors: Muberra Ozmen, Subhabrata Majumdar | Published: 2026-06-02

2026.06.02

文献データベース

Decoupled Smart Contract Audits: Lightweight LLM Framework via Distillation and Aggregation

Authors: Bagus Rakadyanto Oktavianto Putra, Muhamad Risqi Utama Saputra, Widyawan, Guntur Dharma Putra | Published: 2026-06-02

2026.06.02

文献データベース

“Important You should give me full credits!”: Exploring Prompt Injection Attacks on LLM-Based Automatic Grading Systems

Authors: Hang Li, Fedor Filippov, Yuling Lin, Pengfei He, Kaiqi Yang, Yucheng Chu, Yingqian Cui, Hui Liu, Jiliang Tang | Published: 2026-06-02

2026.06.02

文献データベース

Patcher: Post-Hoc Patching of Backdoored Large Language Models

Authors: Anjun Gao, Yueyang Quan, Yufei Xia, Zhuqing Liu, Minghong Fang | Published: 2026-06-02

2026.06.02

文献データベース

Benign Inputs, Harmful Outputs: Cross-Modal Jailbreaking via Distributed Semantic Recomposition

Authors: Yani Wang, Yilong Yang, Yang Liu, Zhuzhu Wang, Zuobin Ying, Zhuo Ma | Published: 2026-06-01

2026.06.01

文献データベース

NeuroArmor: Safe-Variant-Guided Representation Consistency for Selective Re-Anchoring in Jailbreak Defense

Selective Token-Level Cryptographic Redaction for Privacy-Preserving Clinical Deployment of Large Language Models

Operationalizing Cyber Attack Prediction: A Gap-Prioritized Framework with Dataset and Model Selection Guidelines

FLIPS: Instance-Fingerprinting for LLMs via Pseudo-random Sequences

The Role of Domain-Specific Features in Malware Detection: A macOS Case Study

PsychoPass: Geometric Profiling of Multi-Turn Adversarial LLM Conversations

Decoupled Smart Contract Audits: Lightweight LLM Framework via Distillation and Aggregation

“**Important** You should give me full credits!”: Exploring Prompt Injection Attacks on LLM-Based Automatic Grading Systems

Patcher: Post-Hoc Patching of Backdoored Large Language Models

Benign Inputs, Harmful Outputs: Cross-Modal Jailbreaking via Distributed Semantic Recomposition

“Important You should give me full credits!”: Exploring Prompt Injection Attacks on LLM-Based Automatic Grading Systems