Literature Database

Agentic Cloud Decoys: A Deception-Driven Framework for Autonomous Intrusion Investigation

Authors: Mohan Manivannan, Dalal Alharthi | Published: 2026-07-27

Indirect Prompt Injection

報告生成

評価結果

2026.07.27 2026.07.29

Literature Database

Tag Questions and the Generational Reversal of Sycophancy Across 45 Language Models

Authors: Tapan Parikh | Published: 2026-07-27

RAG

Model Communication

User Behavior Analysis

2026.07.27 2026.07.29

Literature Database

Understanding Machine Unlearning Through the Lens of Mode Connectivity

Authors: Jiali Cheng, Hadi Amiri | Published: 2026-07-27

Dataset evaluation

Model Protection Methods

Machine Learning

2026.07.27 2026.07.29

Literature Database

V-DEAL: Diagnosing Video Safety De-Calibration as an Understanding-Refusal Coupling Failure

Authors: Zhetong Zhang, Honghao Fu, Miao Xu, Yiwei Wang, Yujun Cai | Published: 2026-07-23

User Behavior Analysis

Risk Assessment

攻撃手法の効果

2026.07.23 2026.07.25

Literature Database

TOUR: A Trajectory-Level Unlearning Benchmark for Offline Reinforcement Learning

Authors: Chaofan Pan, Lingfei Ren, Xiangyu Jiang, Yanhua Li, Xuemei Cao, Xiangkun Wang, Hao Yu, Wei Wei, Xin Yang | Published: 2026-07-23

Dataset evaluation

攻撃手法の効果

文献レビュー

2026.07.23 2026.07.25

Literature Database

GuardianAgentBench: Where Agents Fail and How to Guard Them

Authors: Vishal Ishwar Naik, Chenyu Xu, Donna Dong, Hussein Hassan, Abhishek Pradhan, Ofer Mendelevitch, Tallat Shafat, Humayun Irshad | Published: 2026-07-23

Indirect Prompt Injection

Task Design

Prompt Injection

2026.07.23 2026.07.25

Literature Database

Is Deep Research Reliable? Misleading Knowledge Induces False Conclusions

Authors: Pengyu Zhu, Lijun Li, Longju Yang, Sen Su | Published: 2026-07-23

Task Design

データセットの問題

Detection of Misinformation

2026.07.23 2026.07.25

Literature Database

Beyond Heavy Log Curation: Perplexity-Based APT Detection via Unsupervised, Context-Augmented Language Models

Authors: Shoya Otsu, Kei Suzuki, Toshiaki Koike-Akino, Jing Liu, Ye Wang | Published: 2026-07-23

Dataset evaluation

Model Communication

Machine Learning

2026.07.23 2026.07.25

Literature Database

Generative AI floods and dilutes the market for books

Authors: Tuhin Chakrabarty, Xinyue Liu, Jane C. Ginsburg, Paramveer Dhillon | Published: 2026-07-22

データセットの問題

User Behavior Analysis

Statistical Analysis

2026.07.22 2026.07.24

Literature Database

The Ethics of Autonomous AI Agents for Offensive Security

Authors: Andreas Happe, Jürgen Cito, Jasmin Wachter | Published: 2026-07-22

Indirect Prompt Injection

倫理基準遵守

責任帰属システム設計

2026.07.22 2026.07.24

Literature Database