Log in Start free

Research/offline_policy_evaluation

StudyPreprintWikioffline_policy_evaluation Reinforcement LearningModerate

Conservative Q-Learning for Offline Reinforcement Learning

Read full paper →

Authors: Aviral Kumar, Aurick Zhou, George Tucker, Sergey Levine
Year: 2020

Read full paper →More offline_policy_evaluation research

Conservative Q-Learning for Offline Reinforcement Learning | Steady Practice | SteadyPractice