Rethinking How to Evaluate Language Model Jailbreak Authors: Hongyu Cai, Arjun Arunasalam, Leo Y. Lin, Antonio Bianchi, Z. Berkay Celik | Published: 2024-04-09 | Updated: 2024-05-07 プロンプトインジェクション悪意のある行為者の分類評価手法 2024.04.09 2025.04.03 文献データベース
The Wolf Within: Covert Injection of Malice into MLLM Societies via an MLLM Operative Authors: Zhen Tan, Chengshuai Zhao, Raha Moraffah, Yifan Li, Yu Kong, Tianlong Chen, Huan Liu | Published: 2024-02-20 | Updated: 2024-06-03 LLMセキュリティ悪意のある行為者の分類攻撃手法 2024.02.20 2025.04.03 文献データベース
Evading Data Contamination Detection for Language Models is (too) Easy Authors: Jasper Dekoninck, Mark Niklas Müller, Maximilian Baader, Marc Fischer, Martin Vechev | Published: 2024-02-05 | Updated: 2024-02-12 データの隠蔽データ汚染検出悪意のある行為者の分類 2024.02.05 2025.04.03 文献データベース
Label Poisoning is All You Need Authors: Rishi D. Jha, Jonathan Hayase, Sewoong Oh | Published: 2023-10-29 セキュリティ分析バックドア攻撃悪意のある行為者の分類 2023.10.29 2025.04.03 文献データベース
On the Safety of Open-Sourced Large Language Models: Does Alignment Really Prevent Them From Being Misused? Authors: Hangfan Zhang, Zhimeng Guo, Huaisheng Zhu, Bochuan Cao, Lu Lin, Jinyuan Jia, Jinghui Chen, Dinghao Wu | Published: 2023-10-02 LLM性能評価プロンプトインジェクション悪意のある行為者の分類 2023.10.02 2025.04.03 文献データベース
Conti Inc.: Understanding the Internal Discussions of a large Ransomware-as-a-Service Operator with Machine Learning Authors: Estelle Ruellan, Masarah Paquet-Clouston, Sebastian Garcia | Published: 2023-08-30 トピックモデルの解釈悪意のある行為者の分類機械学習技術 2023.08.30 2025.04.03 文献データベース
The GANfather: Controllable generation of malicious activity to improve defence systems Authors: Ricardo Ribeiro Pereira, Jacopo Bono, João Tiago Ascensão, David Aparício, Pedro Ribeiro, Pedro Bizarro | Published: 2023-07-25 サイバーセキュリティデータ生成悪意のある行為者の分類 2023.07.25 2025.04.03 文献データベース
Malware Resistant Data Protection in Hyper-connected Networks: A survey Authors: Jannatul Ferdous, Rafiqul Islam, Maumita Bhattacharya, Md Zahidul Islam | Published: 2023-07-24 サイバーセキュリティマルウェア拡散手段悪意のある行為者の分類 2023.07.24 2025.04.03 文献データベース
Early Malware Detection and Next-Action Prediction Authors: Zahra Jamadi, Amir G. Aghdam | Published: 2023-06-09 LSTMモデル性能評価サイバー攻撃悪意のある行為者の分類 2023.06.09 2025.04.03 文献データベース
Backdoor Attacks in Peer-to-Peer Federated Learning Authors: Georgios Syros, Gokberk Yar, Simona Boboila, Cristina Nita-Rotaru, Alina Oprea | Published: 2023-01-23 | Updated: 2024-09-17 バックドア攻撃ポイズニング悪意のある行為者の分類 2023.01.23 2025.04.03 文献データベース