Adaptive Attack Detection in Text Classification: Leveraging Space Exploration Features for Text Sentiment Classification Authors: Atefeh Mahdavi, Neda Keivandarian, Marco Carvalho | Published: 2023-08-29 テキスト生成手法敵対的訓練適応型誤用検出 2023.08.29 2025.04.03 文献データベース
On the Steganographic Capacity of Selected Learning Models Authors: Rishit Agrawal, Kelvin Jou, Tanush Obili, Daksh Parikh, Samarth Prajapati, Yash Seth, Charan Sridhar, Nathan Zhang, Mark Stamp | Published: 2023-08-29 データ生成機械学習手法透かしの耐久性 2023.08.29 2025.04.03 文献データベース
Gender bias and stereotypes in Large Language Models Authors: Hadas Kotek, Rikker Dockum, David Q. Sun | Published: 2023-08-28 AIによる出力のバイアスの検出アルゴリズムの公平性大規模言語モデル 2023.08.28 2025.04.03 文献データベース
Generating tabular datasets under differential privacy Authors: Gianluca Truda | Published: 2023-08-28 データ生成プライバシー保護プライバシー保護手法 2023.08.28 2025.04.03 文献データベース
Are Existing Out-Of-Distribution Techniques Suitable for Network Intrusion Detection? Authors: Andrea Corsini, Shanchieh Jay Yang | Published: 2023-08-28 Out-of-Distribution検出未知の攻撃検出機械学習手法 2023.08.28 2025.04.03 文献データベース
Detecting Language Model Attacks with Perplexity Authors: Gabriel Alon, Michael Kamfonas | Published: 2023-08-27 | Updated: 2023-11-07 LLMセキュリティプロンプトインジェクション悪意のあるプロンプト 2023.08.27 2025.04.03 文献データベース
LMSanitator: Defending Prompt-Tuning Against Task-Agnostic Backdoors Authors: Chengkun Wei, Wenlong Meng, Zhikun Zhang, Min Chen, Minghu Zhao, Wenjing Fang, Lei Wang, Zihui Zhang, Wenzhi Chen | Published: 2023-08-26 | Updated: 2023-10-14 トリガーの検知バックドアモデルの検知攻撃手法 2023.08.26 2025.04.03 文献データベース
Uncovering Promises and Challenges of Federated Learning to Detect Cardiovascular Diseases: A Scoping Literature Review Authors: Sricharan Donkada, Seyedamin Pouriyeh, Reza M. Parizi, Meng Han, Nasrin Dehbozorgi, Nazmus Sakib, Quan Z. Sheng | Published: 2023-08-26 スマートヘルスケア医療AIの脅威連合学習 2023.08.26 2025.04.03 文献データベース
Active learning for fast and slow modeling attacks on Arbiter PUFs Authors: Vincent Dumoulin, Wenjing Rao, Natasha Devroye | Published: 2023-08-25 PUFの評価手法アクティブラーニング機械学習手法 2023.08.25 2025.04.03 文献データベース
ZeroLeak: Using LLMs for Scalable and Cost Effective Side-Channel Patching Authors: M. Caner Tol, Berk Sunar | Published: 2023-08-24 LLMセキュリティ脆弱性回避手法透かしの耐久性 2023.08.24 2025.04.03 文献データベース