ページ 6 | AIセキュリティポータル

Learn from Your Mistakes: Tree-like Self-Play for Secure Code LLMs

Authors: Wenqi Chen, Ziyan Zhang, Bing Wang, Lin Liu, Hengheng Zhang, Zhengsu Chen | Published: 2026-06-02

2026.06.02

文献データベース

NeuroArmor: Safe-Variant-Guided Representation Consistency for Selective Re-Anchoring in Jailbreak Defense

Authors: Zhongyang Lin, Ziran Zhao, Feifei Zhai, Pengyuan Liu | Published: 2026-06-02

2026.06.02

文献データベース

Selective Token-Level Cryptographic Redaction for Privacy-Preserving Clinical Deployment of Large Language Models

Authors: Farhan Sheth, Ziyuan Yang, Yongying Lan, Si Yong Yeo | Published: 2026-06-02

2026.06.02

文献データベース

Operationalizing Cyber Attack Prediction: A Gap-Prioritized Framework with Dataset and Model Selection Guidelines

Authors: Aminu Muhammad Auwal | Published: 2026-06-02

2026.06.02

文献データベース

FLIPS: Instance-Fingerprinting for LLMs via Pseudo-random Sequences

Authors: Gurvan Richardeau, Gohar Dashyan, Erwan Le Merrer, Gilles Tredan | Published: 2026-06-02

2026.06.02

文献データベース

The Role of Domain-Specific Features in Malware Detection: A macOS Case Study

Authors: Biagio Montaruli, Andrea Oliveri, Savino Dambra, Davide Balzarotti | Published: 2026-06-02

2026.06.02

文献データベース

PsychoPass: Geometric Profiling of Multi-Turn Adversarial LLM Conversations

Authors: Muberra Ozmen, Subhabrata Majumdar | Published: 2026-06-02

2026.06.02

文献データベース

Decoupled Smart Contract Audits: Lightweight LLM Framework via Distillation and Aggregation

Authors: Bagus Rakadyanto Oktavianto Putra, Muhamad Risqi Utama Saputra, Widyawan, Guntur Dharma Putra | Published: 2026-06-02

2026.06.02

文献データベース

“Important You should give me full credits!”: Exploring Prompt Injection Attacks on LLM-Based Automatic Grading Systems

Authors: Hang Li, Fedor Filippov, Yuling Lin, Pengfei He, Kaiqi Yang, Yucheng Chu, Yingqian Cui, Hui Liu, Jiliang Tang | Published: 2026-06-02

2026.06.02

文献データベース

Patcher: Post-Hoc Patching of Backdoored Large Language Models

Authors: Anjun Gao, Yueyang Quan, Yufei Xia, Zhuqing Liu, Minghong Fang | Published: 2026-06-02

2026.06.02

文献データベース

Learn from Your Mistakes: Tree-like Self-Play for Secure Code LLMs

NeuroArmor: Safe-Variant-Guided Representation Consistency for Selective Re-Anchoring in Jailbreak Defense

Selective Token-Level Cryptographic Redaction for Privacy-Preserving Clinical Deployment of Large Language Models

Operationalizing Cyber Attack Prediction: A Gap-Prioritized Framework with Dataset and Model Selection Guidelines

FLIPS: Instance-Fingerprinting for LLMs via Pseudo-random Sequences

The Role of Domain-Specific Features in Malware Detection: A macOS Case Study

PsychoPass: Geometric Profiling of Multi-Turn Adversarial LLM Conversations

Decoupled Smart Contract Audits: Lightweight LLM Framework via Distillation and Aggregation

“**Important** You should give me full credits!”: Exploring Prompt Injection Attacks on LLM-Based Automatic Grading Systems

Patcher: Post-Hoc Patching of Backdoored Large Language Models

“Important You should give me full credits!”: Exploring Prompt Injection Attacks on LLM-Based Automatic Grading Systems