Reward Mechanism Design

Secure Tug-of-War (SecTOW): Iterative Defense-Attack Training with Reinforcement Learning for Multimodal Model Security

Authors: Muzhi Dai, Shixuan Liu, Zhiyuan Zhao, Junyu Gao, Hao Sun, Xuelong Li | Published: 2025-07-29

Reinforcement Learning Optimization

Defense Method

2025.07.29 2025.07.31

Literature Database

Direct Preference Optimization: Your Language Model is Secretly a Reward Model

Authors: Rafael Rafailov, Archit Sharma, Eric Mitchell, Stefano Ermon, Christopher D. Manning, Chelsea Finn | Published: 2023-05-29 | Updated: 2024-07-29

Alignment

Reward Mechanism Design

Reinforcement Learning Optimization

2023.05.29 2025.05.28

Literature Database

RRHF: Rank Responses to Align Language Models with Human Feedback without tears

Authors: Zheng Yuan, Hongyi Yuan, Chuanqi Tan, Wei Wang, Songfang Huang, Fei Huang | Published: 2023-04-11 | Updated: 2023-10-07

Alignment

Reward Mechanism Design

Reinforcement Learning Optimization

2023.04.11 2025.05.28

Literature Database

IronForge: An Open, Secure, Fair, Decentralized Federated Learning

Authors: Guangsheng Yu, Xu Wang, Caijun Sun, Qin Wang, Ping Yu, Wei Ni, Ren Ping Liu, Xiwei Xu | Published: 2023-01-07

Privacy Enhancing Technology

Prompt Injection

Reward Mechanism Design

2023.01.07 2025.05.28

Literature Database

Ares: A System-Oriented Wargame Framework for Adversarial ML

Authors: Farhan Ahmed, Pratik Vaishnavi, Kevin Eykholt, Amir Rahmati | Published: 2022-10-24

Poisoning

Reward Mechanism Design

Evaluation Method

2022.10.24 2025.05.28

Literature Database

Blockchain and Machine Learning for Fraud Detection: A Privacy-Preserving and Adaptive Incentive Based Approach

Authors: Tahmid Hasan Pranto, Kazi Tamzid Akhter Md Hasib, Tahsinur Rahman, AKM Bahalul Haque, A. K. M. Najmul Islam, Rashedur M. Rahman | Published: 2022-10-23

Integration of Blockchain and FL

Fraudulent Transaction

Reward Mechanism Design

2022.10.23 2025.05.28

Literature Database

Reinforcement Learning for Hardware Security: Opportunities, Developments, and Challenges

Authors: Satwik Patnaik, Vasudev Gohil, Hao Guo, Jeyavijayan, Rajendran | Published: 2022-08-29

Reward Mechanism Design

Optimization Problem

Machine Learning Technology

2022.08.29 2025.05.28

Literature Database

Understanding the Limits of Poisoning Attacks in Episodic Reinforcement Learning

Authors: Anshuka Rangi, Haifeng Xu, Long Tran-Thanh, Massimo Franceschetti | Published: 2022-08-29

Cyber Attack

Reward Mechanism Design

Optimization Problem

2022.08.29 2025.05.28

Literature Database

Dual-Mandate Patrols: Multi-Armed Bandits for Green Security

Authors: Lily Xu, Elizabeth Bondi, Fei Fang, Andrew Perrault, Kai Wang, Milind Tambe | Published: 2020-09-14 | Updated: 2024-04-26

Reward Mechanism Design

Performance Evaluation Metrics

Selection and Evaluation of Optimization Algorithms

2020.09.14 2025.05.28

Literature Database

Enhanced Adversarial Strategically-Timed Attacks against Deep Reinforcement Learning

Authors: Chao-Han Huck Yang, Jun Qi, Pin-Yu Chen, Yi Ouyang, I-Te Danny Hung, Chin-Hui Lee, Xiaoli Ma | Published: 2020-02-20

Reward Mechanism Design

Vulnerability Prediction

Defense Method

2020.02.20 2025.05.28

Literature Database