心理的操作

Talking Like a Phisher: LLM-Based Attacks on Voice Phishing Classifiers

Authors: Wenhao Li, Selvakumar Manickam, Yung-wey Chong, Shankar Karuppayah | Published: 2025-07-22

プロンプトリーキング

心理的操作

敵対的攻撃手法

2025.07.22

文献データベース

Security Concerns for Large Language Models: A Survey

Authors: Miles Q. Li, Benjamin C. M. Fung | Published: 2025-05-24 | Updated: 2025-08-20

インダイレクトプロンプトインジェクション

プロンプトインジェクション

心理的操作

2025.05.24

文献データベース

Steering the CensorShip: Uncovering Representation Vectors for LLM “Thought” Control

Authors: Hannah Cyberey, David Evans | Published: 2025-04-23

プロンプトインジェクション

心理的操作

透かし

2025.04.23

文献データベース

What is in Your Safe Data? Identifying Benign Data that Breaks Safety

Authors: Luxi He, Mengzhou Xia, Peter Henderson | Published: 2024-04-01 | Updated: 2024-08-20

データ選択戦略

プロンプトインジェクション

心理的操作

2024.04.01 2025.04.03

文献データベース

PsySafe: A Comprehensive Framework for Psychological-based Attack, Defense, and Evaluation of Multi-agent System Safety

Authors: Zaibin Zhang, Yongting Zhang, Lijun Li, Hongzhi Gao, Lijun Wang, Huchuan Lu, Feng Zhao, Yu Qiao, Jing Shao | Published: 2024-01-22 | Updated: 2024-08-20

プロンプトインジェクション

安全性アライメント

心理的操作

2024.01.22 2025.04.03

文献データベース

Exploiting Large Language Models (LLMs) through Deception Techniques and Persuasion Principles

Authors: Sonali Singh, Faranak Abri, Akbar Siami Namin | Published: 2023-11-24

AIチャットボットの悪用

プロンプトインジェクション

心理的操作

2023.11.24 2025.04.03

文献データベース

Using Blockchain to Rein in The New Post-Truth World and Check The Spread of Fake News

Authors: Adnan Qayyum, Junaid Qadir, Muhammad Umar Janjua, Falak Sher | Published: 2019-03-28

偽情報の検出

心理的操作

情報漏洩の原因

2019.03.28 2025.04.03

文献データベース