AIセキュリティポータルbot | ページ 54 | AIセキュリティポータル

Measuring Physical-World Privacy Awareness of Large Language Models: An Evaluation Benchmark

Authors: Xinjie Shen, Mufei Li, Pan Li | Published: 2025-09-27 | Updated: 2025-10-13

ハルシネーション

プライバシー保護技術

倫理的選択評価

2025.09.27

文献データベース

MaskSQL: Safeguarding Privacy for LLM-Based Text-to-SQL via Abstraction

Authors: Sepideh Abedini, Shubhankar Mohapatra, D. B. Emerson, Masoumeh Shafieinejad, Jesse C. Cresswell, Xi He | Published: 2025-09-27 | Updated: 2025-09-30

SQLクエリ生成

プロンプトインジェクション

プロンプトリーキング

2025.09.27

文献データベース

LLM Watermark Evasion via Bias Inversion

Authors: Jeongyeon Hwang, Sangdon Park, Jungseul Ok | Published: 2025-09-27 | Updated: 2025-10-01

LLMの安全機構の解除

モデルインバージョン

統計的検定

2025.09.27

文献データベース

Secure and Efficient Access Control for Computer-Use Agents via Context Space

Authors: Haochen Gong, Chenxiao Li, Rui Chang, Wenbo Shen | Published: 2025-09-26 | Updated: 2025-10-21

インダイレクトプロンプトインジェクション

エージェント設計

セキュリティメトリック

2025.09.26

文献データベース

Defending MoE LLMs against Harmful Fine-Tuning via Safety Routing Alignment

Authors: Jaehan Kim, Minkyoo Song, Seungwon Shin, Sooel Son | Published: 2025-09-26 | Updated: 2025-10-09

AIによる出力のバイアスの検出

ロバスト性

防御メカニズム

2025.09.26

文献データベース

Backdoor Attribution: Elucidating and Controlling Backdoor in Language Models

Authors: Miao Yu, Zhenhong Zhou, Moayad Aloqaily, Kun Wang, Biwei Huang, Stephen Wang, Yueming Jin, Qingsong Wen | Published: 2025-09-26 | Updated: 2025-09-30

LLMの安全機構の解除

自己注意メカニズム

解釈可能性

2025.09.26

文献データベース

It’s not Easy: Applying Supervised Machine Learning to Detect Malicious Extensions in the Chrome Web Store

Authors: Ben Rosenzweig, Valentino Dalla Valle, Giovanni Apruzzese, Aurore Fass | Published: 2025-09-25 | Updated: 2025-10-02

プログラム解析

ユーザー活動解析

悪意のあるパッケージ検出

2025.09.25

文献データベース

No Prior, No Leakage: Revisiting Reconstruction Attacks in Trained Neural Networks

Authors: Yehonatan Refael, Guy Smorodinsky, Ofir Lindenbaum, Itay Safran | Published: 2025-09-25

トレーニングデータ生成

プライバシー保護メカニズム

プライバシー保護手法

2025.09.25

文献データベース

EvoMail: Self-Evolving Cognitive Agents for Adaptive Spam and Phishing Email Defense

Authors: Wei Huang, De-Tian Chu, Lin-Yuan Bai, Wei Kang, Hai-Tao Zhang, Bo Li, Zhi-Mo Han, Jing Ge, Hai-Feng Lin | Published: 2025-09-25

フィッシング攻撃

大規模言語モデル

自己進化型フレームワーク

2025.09.25

文献データベース

PMark: Towards Robust and Distortion-free Semantic-level Watermarking with Channel Constraints

Authors: Jiahao Huo, Shuliang Liu, Bin Wang, Junyan Zhang, Yibo Yan, Aiwei Liu, Xuming Hu, Mingxun Zhou | Published: 2025-09-25

アルゴリズム

生成AI向け電子透かし

透かし技術の堅牢性

2025.09.25

文献データベース