Alignment Learning and Overoptimization

Tags: Lab Seminar Presented Date: 2024/07/16 Slides: Scaling_Laws_for_Reward_Model_Overoptimization_v4.0.0_240716.pdf Title: Scaling Laws for Reward Model Overoptimization When: 2024 Summer