AIセキュリティポータルbot

Spider-Sense: Intrinsic Risk Sensing for Efficient Agent Defense with Hierarchical Adaptive Screening

Authors: Zhenxiong Yu, Zhi Yang, Zhiheng Jin, Shuhe Wang, Heng Zhang, Yanlin Fei, Lingfeng Zeng, Fangqi Lou, Shuo Zhang, Tu Hu, Jingping Liu, Rongze Chen, Xingyu Zhu, Kunyi Wang, Chaofa Yuan, Xin Guo, Zhaowei Liu, Feipeng Zhang, Jie Huang, Huacan Wang, Ronghao Chen, Liwen Zhang | Published: 2026-02-05

攻撃手法の説明

Content Specialized for Toxicity Attacks

2026.02.05 2026.02.07

Literature Database

SynAT: Enhancing Security Knowledge Bases via Automatic Synthesizing Attack Tree from Crowd Discussions

Authors: Ziyou Jiang, Lin Shi, Guowei Yang, Xuyan Ma, Fenglong Li, Qing Wang | Published: 2026-02-05

LLM Performance Evaluation

Safety of Data Generation

攻撃ツリー合成

2026.02.05 2026.02.07

Literature Database

Hallucination-Resistant Security Planning with a Large Language Model

Authors: Kim Hammar, Tansu Alpcan, Emil Lupu | Published: 2026-02-05

LLM Performance Evaluation

Hallucination

Detection of Hallucinations

2026.02.05 2026.02.07

Literature Database

Comparative Insights on Adversarial Machine Learning from Industry and Academia: A User-Study Approach

Authors: Vishruti Kakkad, Paul Chung, Hanan Hibshi, Maverick Woo | Published: 2026-02-04

Poisoning

Model Extraction Attack

教育手法

2026.02.04 2026.02.06

Literature Database

How Few-shot Demonstrations Affect Prompt-based Defenses Against LLM Jailbreak Attacks

Authors: Yanshu Wang, Shuaishuai Yang, Jingjing He, Tong Yang | Published: 2026-02-04

LLM Performance Evaluation

Prompt Injection

Large Language Model

2026.02.04 2026.02.06

Literature Database

Semantic Consensus Decoding: Backdoor Defense for Verilog Code Generation

Authors: Guang Yang, Xing Hu, Xiang Chen, Xin Xia | Published: 2026-02-04

Security of Code Generation

Backdoor Detection

Model Extraction Attack

2026.02.04 2026.02.06

Literature Database

Attack-Resistant Uniform Fairness for Linear and Smooth Contextual Bandits

Authors: Qingwen Zhang, Wenjia Wang | Published: 2026-02-04

Algorithm Design

Robust Estimation

Statistical Methods

2026.02.04 2026.02.06

Literature Database

Detecting and Explaining Malware Family Evolution Using Rule-Based Drift Analysis

Authors: Olha Jurečková, Martin Jureček | Published: 2026-02-03

マルウェアファミリー

ルールベース分類

Adversarial Example Detection

2026.02.03 2026.02.05

Literature Database

LogicScan: An LLM-driven Framework for Detecting Business Logic Vulnerabilities in Smart Contracts

Authors: Jiaqi Gao, Zijian Zhang, Yuqiang Sun, Ye Liu, Chengwei Liu, Han Liu, Yi Li, Yang Liu | Published: 2026-02-03

LLM Performance Evaluation

スマートコントラクト攻撃

Prompt leaking

2026.02.03 2026.02.05

Literature Database

Spider-Sense: Intrinsic Risk Sensing for Efficient Agent Defense with Hierarchical Adaptive Screening

SynAT: Enhancing Security Knowledge Bases via Automatic Synthesizing Attack Tree from Crowd Discussions

Hallucination-Resistant Security Planning with a Large Language Model

Comparative Insights on Adversarial Machine Learning from Industry and Academia: A User-Study Approach

How Few-shot Demonstrations Affect Prompt-based Defenses Against LLM Jailbreak Attacks

Semantic Consensus Decoding: Backdoor Defense for Verilog Code Generation

Attack-Resistant Uniform Fairness for Linear and Smooth Contextual Bandits

Don’t believe everything you read: Understanding and Measuring MCP Behavior under Misleading Tool Descriptions

Detecting and Explaining Malware Family Evolution Using Rule-Based Drift Analysis

LogicScan: An LLM-driven Framework for Detecting Business Logic Vulnerabilities in Smart Contracts