What is in Your Safe Data? Identifying Benign Data that Breaks Safety Authors: Luxi He, Mengzhou Xia, Peter Henderson | Published: 2024-04-01 | Updated: 2024-08-20 データ選択戦略プロンプトインジェクション心理的操作 2024.04.01 2025.04.03 文献データベース
PsySafe: A Comprehensive Framework for Psychological-based Attack, Defense, and Evaluation of Multi-agent System Safety Authors: Zaibin Zhang, Yongting Zhang, Lijun Li, Hongzhi Gao, Lijun Wang, Huchuan Lu, Feng Zhao, Yu Qiao, Jing Shao | Published: 2024-01-22 | Updated: 2024-08-20 プロンプトインジェクション安全性アライメント心理的操作 2024.01.22 2025.04.03 文献データベース
Exploiting Large Language Models (LLMs) through Deception Techniques and Persuasion Principles Authors: Sonali Singh, Faranak Abri, Akbar Siami Namin | Published: 2023-11-24 AIチャットボットの悪用プロンプトインジェクション心理的操作 2023.11.24 2025.04.03 文献データベース
Using Blockchain to Rein in The New Post-Truth World and Check The Spread of Fake News Authors: Adnan Qayyum, Junaid Qadir, Muhammad Umar Janjua, Falak Sher | Published: 2019-03-28 偽情報の検出心理的操作情報漏洩の原因 2019.03.28 2025.04.03 文献データベース