Alignment Learning and Overoptimization

Tags: Lab Seminar Presented Date: 2024/07/16 Slides: Scaling_Laws_for_Reward_Model_Overoptimization_v4.0.0_240716.pdf Title: Scaling Laws for Reward Model Overoptimization When: 2024 Summer

Slide1.jpeg

Slide2.jpeg

Slide3.jpeg

Slide4.jpeg

Slide5.jpeg

Slide6.jpeg

Slide7.jpeg

Slide8.jpeg

Slide9.jpeg

Slide10.jpeg

Slide11.jpeg

Slide12.jpeg

Slide13.jpeg

Slide14.jpeg

Slide15.jpeg

Slide16.jpeg

Slide17.jpeg

Slide18.jpeg

Slide19.jpeg

Slide20.jpeg

Slide21.jpeg

Slide22.jpeg

Slide23.jpeg

Slide24.jpeg

Slide25.jpeg

Slide26.jpeg

Slide27.jpeg

Slide28.jpeg

Slide29.jpeg

Slide30.jpeg

Slide31.jpeg

Slide32.jpeg

Slide33.jpeg

Slide34.jpeg

Slide35.jpeg

Slide36.jpeg