The Hyperfitting Phenomenon: Sharpening and Stabilizing LLMs for Open-Ended Text Generation
- Authors: Fredrik Carlsson, Fangyu Liu, Daniel Ward, Murathan Kurfali, Joakim Nivre
- Paper: https://openreview.net/pdf?id=Ij9ilPh36h
- Affiliation: Google DeepMind, RISE Research Institutes of Sweden, Uppsala Univ.
- Published: January 23, 2025
TL; DR
LLM์ ์์ ์ฌ์ด์ฆ ๋ฐ์ดํฐ์ overfitting์ํค๋๊ฒ ์คํ๋ ค generation ์ฑ๋ฅ์ ํฅ์์ํฌ ์ ์๋ค.






Background
ํต์ ๊ณผ์ ํฉ์ ๋ชจ๋ธ ์ผ๋ฐํ ์ฑ๋ฅ์ ์ ํํค๋ ๊ฒ์ผ๋ก ์๋ ค์ง
Problem States
- LLM ์์ฑ์ greedy decoding ํน์ฑ์ ๋ฐ๋ณต์ ์ธ ํจํด ์์ฑ
- ์ด๋ฅผ ๋ฐฉ์งํ๊ธฐ ์ํด sampling์ด๋ repetition ์ ์ฝ ๋ฑ์ ์ ์ฉํ์ง๋ง, ๊ทผ์์์ ์ธ ํด๊ฒฐ์ ๊ทธ์นจ (prediction distribution์ ๊ฑด๋ค์ง๋ ์์)
- Research Question: LLM์ ์์ฃผ ์์ ๋ฐ์ดํฐ์ ์ผ๋ก ๊ณผ์ ํฉ ์ํค๋ฉด ์ด๋ป๊ฒ ๋ ๊น? ์ด๊ฒ ๋ชจ๋ธ์ด ๊ธด ํ ์คํธ ์์ฑ ํ์ง ํฅ์์ ๊ธฐ์ฌํ ์ ์๋?
Suggestion
Hyperfitting
- ๊ธฐ์กด LLM์ย ๊ทน์๋์ ๋ฐ์ดํฐ์ ์ ๋ํด fine-tuning,ย training loss ๊ฑฐ์ 0์ผ๋ก ๋ง๋ค๋๋ก ํ์ต
- ์ผ๋ฐ์ ์ธ fine-tuning๊ณผ ๋ฌ๋ฆฌย validation loss๋ ์ฆ๊ฐํ์ง๋ง,ย ํ ์คํธ ์์ฑ ์ฑ๋ฅ(๋ค์์ฑ, ์ผ๊ด์ฑ)์ด ํฅ์๋จ์ ํ์ธํจ.
- ์๋ ๊ฐ๋
Grokking: ํ๋ จ ์ค ์ผ์ ์์ ์ดํ ๊ฐ์๊ธฐ ์ผ๋ฐํ ์ฑ๋ฅ์ด ๊ธ์์นํ๋ ํ์Double Descent: ๊ณผ์ ํฉ ์ดํ ์ถ๊ฐ ํ๋ จ ์ ์คํ๋ ค validation ์ฑ๋ฅ์ด ํ๋ณต๋๋ ํ์(์ ์)Hyperfittingย : training loss 0์ผ๋ก ์๋ ดํ ๋ ์ผ๋ฐํ ์ฑ๋ฅ ํฅ์๋๋ ํ์
Effects
- backbone: TinyLlama(1.1B), DeepSeek(7B), Llama 3.1 (8B & 70B) ๋ฑโฆ
- text ์์ฑ ํ์ง ํฅ์
- hyperfitting๋ ๋ชจ๋ธ์ Greedy Decoding๋ง์ผ๋ก๋ ์ผ๋ฐ ๋ชจ๋ธ๋ณด๋ค ๋ ๋ค์ํ๊ณ ํ์ง ๋์ ํ ์คํธ๋ฅผ ์์ฑ
- 128-/256-token์ ์์ฑ ๊ฒฐ๊ณผ์ ๋ํด human evaluation์์๋ ๋์ ์ ํธ
- repetition ๋ฌธ์ ํด๊ฒฐ
- ํ์ต ๋ฐ์ดํฐ์ ์ ๊ทธ๋๋ก copyํ๋ ๋น์จ์ด ๋ ์ ์
- citation blocking (training set ์ผ๋ถ๋ฅผ block)ํด๋ ์ฌ์ ํ ์์ฐ์ค๋ฌ์ด text ์์ฑ
- predicted distribution ์ง์ ์์
- ์์ฃผ ๋ฎ์ entropy์ ํ๋ฅ ๋ถํฌ๋ฅผ ๊ฐ์ง = ํน์ token์ ํ์คํ๊ฒ ์ง์ด์ ์์ฑํจ (์์ฑ์ ํ๋ฅ ์ด ๋์)
- ์ด์ ๋ฐ๋ผ perplexity๋ ๋์ด๋ ๊ฒฐ๊ณผ์ ์ผ๋ก ์์ฑ ํ์ง์ ํฅ์๋๋ค๊ณ .
- ๋ฐ์ดํฐ ์์กด๋ ํ๋ฝ
- 2000๊ฐ ๋ฏธ๋ง ๋ฐ์ดํฐ์ ์ผ๋ก๋ ํ์ดํผ ํผํ ์ ๊ฐ๋ฅ
- ํ๋ จ ๋ฐ์ดํฐ ์์๋ง ์์ด๋ ๋ชจ๋ธ ์์ธก ํ ํฐ ๋ถํฌ๊ฐ ํฌ๊ฒ ๋ฌ๋ผ์ง = ๋ฐ์ดํฐ ์์ฒด๋ณด๋ค ํ์ดํผ ํผํ ์ด ๋ชจ๋ธ ์์ธก ๋ฐฉ์์ ๋ ํฐ ์ํฅ
- ๋ฐ์ดํฐ ์ข ๋ฅ (๋ด์ค๊ฑฐ๋, ํฝ์ ์ด๊ฑฐ๋)์ ์ฐจ์ด๊ฐ ์๊ธด ํ์ง๋ง ์ ์ํ๋ค๊ณ ๋ณผ ์ฆ๊ฑฐ๋ ๋ถ์กฑํจ
Personal note. ์ด๋ฏธ์ง ๋ฐ์ดํฐ์๋ ์จ๋ดค๋ค๋๋ฐ ์ ์ํ๊ฒ ๊ฐ๋ค๋ ๊ฒฐ๋ก ๊น์ง ๊ฝค ํฅ๋ฏธ๋ก์ด ํ๋ฆ.. metric์ผ๋ก ์์ฃผ ์ธ๊ธ๋๋ TTR์ type-token ratio๋ผ๊ณ ์์ฑ๋ ํ ํฐ ๋ค์์ฑ์ ์ธก์ ํ๋๋ฐ ํ์ฉ๋ฉ๋๋ค. ๋์์๋ก ๋ค์ํ๋ค๋ ์๋ฏธ. ๊ตฌ์ฒด์ ์ธ task์ ์ ์ฉํด๋ณด์ง ์์๋ค๋๊ฐ(์ ์ฉ์ฑ ์ธก๋ฉด์์), ์คํ ๋ชจ๋ธ ์ฌ์ด์ฆ๊ฐ ์์ ์ชฝ ์์ฃผ์๋๊ฒ ์ข ํ ์ธ ๊ฒ ๊ฐ์๋ฐ ๋ชจ๋ธ ์ฌ์ด์ฆ ํค์ฐ๊ณ ๋ฐ์ดํฐ์ ์ฌ์ด์ฆ๋ ๋ณด๋ค ํค์ ์ ๋ ์ด๋ค ์์์ ๋์ง ํ์ธํด๋ณผ ํ์๋ ์์ด ๋ณด์ ๋๋ค. (70B ๋ชจ๋ธ ๊ฒฐ๊ณผ๋ ์ต๊ทผ ์ ๋ฐ์ดํธ ๋จ) ์ ์๋ค๋ ์ถ๊ฐ ์คํ๊ณผ ์ถ์ธ ํ์ธ์ด ํ์ํ๋ค๋ ๋ถ๋ถ์ ์ธ์ ํ๊ณ ์์ต๋๋ค. ๊ตฌํ์ฒด๊ฐ ์์ง ์๊ธด ํ๋ฐ ๊ตฌํ์ด ์ด๋ ค์ธ ๊ฒ ๊ฐ์ง๋ ์์ต๋๋ค.