AIセキュリティポータルbot | ページ 88 | AIセキュリティポータル

The Scales of Justitia: A Comprehensive Survey on Safety Evaluation of LLMs

Authors: Songyang Liu, Chaozhuo Li, Jiameng Qiu, Xi Zhang, Feiran Huang, Litian Zhang, Yiming Hei, Philip S. Yu | Published: 2025-06-06 | Updated: 2025-10-30

アライメント

大規模言語モデル

安全性評価

2025.06.06

文献データベース

Watermarking Degrades Alignment in Language Models: Analysis and Mitigation

Authors: Apurv Verma, NhatHai Phan, Shubhendu Trivedi | Published: 2025-06-04 | Updated: 2025-07-10

性能評価指標

生成AI向け電子透かし

透かし

2025.06.04

文献データベース

TracLLM: A Generic Framework for Attributing Long Context LLMs

Authors: Yanting Wang, Wei Zou, Runpeng Geng, Jinyuan Jia | Published: 2025-06-04

LLMとの協力効果

RAGへのポイズニング攻撃

効率評価

2025.06.04

文献データベース

Privacy and Security Threat for OpenAI GPTs

Authors: Wei Wenying, Zhao Kaifa, Xue Lei, Fan Ming | Published: 2025-06-04

LLMの安全機構の解除

プライバシー問題

防御メカニズム

2025.06.04

文献データベース

Evaluating Apple Intelligence’s Writing Tools for Privacy Against Large Language Model-Based Inference Attacks: Insights from Early Datasets

Authors: Mohd. Farhan Israk Soumik, Syed Mhamudul Hasan, Abdur R. Shahid | Published: 2025-06-04

テキスト分類の応用

プライバシー問題

プロンプトインジェクション

2025.06.04

文献データベース

Client-Side Zero-Shot LLM Inference for Comprehensive In-Browser URL Analysis

Authors: Avihay Cohen | Published: 2025-06-04

アライメント

プロンプトインジェクション

動的分析

2025.06.04

文献データベース

A Threat Intelligence Event Extraction Conceptual Model for Cyber Threat Intelligence Feeds

Authors: Jamal H. Al-Yasiri, Mohamad Fadli Bin Zolkipli, Nik Fatinah N Mohd Farid, Mohammed Alsamman, Zainab Ali Mohammed | Published: 2025-06-04

サイバー脅威

効率評価

情報抽出手法

2025.06.04

文献データベース

Software Bill of Materials in Software Supply Chain Security A Systematic Literature Review

Authors: Eric O'Donoghue, Yvette Hastings, Ernesto Ortiz, A. Redempta Manzi Muneza | Published: 2025-06-04

SBOM分析

リスク評価

情報漏洩の原因

2025.06.04

文献データベース

Differentially Private Distribution Release of Gaussian Mixture Models via KL-Divergence Minimization

Authors: Hang Liu, Anna Scaglione, Sean Peisert | Published: 2025-06-04

匿名化技術

差分プライバシー

最適化問題

2025.06.04

文献データベース

ATAG: AI-Agent Application Threat Assessment with Attack Graphs

Authors: Parth Atulbhai Gandhi, Akansha Shukla, David Tayouri, Beni Ifland, Yuval Elovici, Rami Puzis, Asaf Shabtai | Published: 2025-06-03

インダイレクトプロンプトインジェクション

グラフ構築

リスク評価

2025.06.03

文献データベース