LLM Evaluators Recognize and Favor Their Own Generations
Meta info.
- Authors: Arjun Panickssery, Samuel R. Bowman, Shi Feng
- Paper: https://openreview.net/pdf?id=4NJBV6Wp0h
- Affiliation: George Washington Univ., MATS, New York Univ.
- Published: September 26, 2024
- Conference: NeurIPS2024

TL; DR
LLM์ ์๊ธฐ๊ฐ ๋ง๋ ๊ฒฐ๊ณผ๋ฅผ ์ ํธํ๋ค๋ ๊ธฐ์กด ์ฃผ์ฅ์ ๋ํ ์ฌ์ธต ๋
ผ์ (๊ฒฐ๋ก : ์ค์ ๊ทธ๋ ๋ค)

Background
LLM์ผ๋ก ์์ฑํ ๊ฒฐ๊ณผ๋ฅผ ํ๊ฐํ ๋ judge๋ก LLM(์ค์ค๋ก)์ ์ฌ์ฉํ๋ ๊ฒ์ด ์ผ๋ฐํ๋จ
Problem States
๋ชจ๋ธ์ ์๊ธฐ๊ฐ ์์ฑํ๊ฑธ ์ ํธํ๋ค๋๋ผ (์๊ธฐ์ ํธ)
- Research Question: ๋ชจ๋ธ์ด ์ค์ค๋ก ์์ฑํ ๊ฒ์ธ์ง๋ฅผ ์ธ์ํ๋ฉด(์๊ธฐ์ธ์) ์๊ธฐ ์ ํธ์ ์ํฅ์ ๋ฏธ์น ๊น?
Suggestion
์๊ธฐ ์ธ์์ ๋ํ tuning
- task: ๋ชจ๋ธ์ด ์๊ธฐ๊ฐ ๋ง๋ text์ธ์ง ๋ถ๋ฅ
- data: ์๊ธฐ๊ฐ ๋ง๋ text / ์ฌ๋์ด ๋ง๋ text pair
Effect
- Experimental setup:
- task: text summarization
- dataset: XSUM, CNN/DailyMail (๋ด์ค๊ธฐ์ฌ)
- backbone: Llama-2-7b-chat, GPT-3.5, GPT-4
- Results:
- GPT-4 ๋ฑ vanilla LLM์ ์๊ธฐ ์ธ์์ ์ ํ๋ ๊ฒ์ ์๋์์ผ๋,
- ์๊ธฐ ์ธ์์ ๋ํด์ ํ๋์ ํ๋ฉด, ์๊ธฐ ์ธ์์ ๊ฑฐ์ ์๋ฒฝํ๊ฒ ํ์ ๊ฐ๋ฅํ๊ณ ,
- ๊ทธ์ ๋ฐ๋ผ ์๊ธฐ์ธ์๊ณผ ์ ํธ ์ฌ์ด ๊ฐํ ์ ํ ๊ด๊ณ ํ์ธ
Personal note. LLM-as-a-judge ์คํ์ผ์ด ์ฐ๊ตฌ ํ๋์์ ์ผ๋ฐ๋ก ์ฒ๋ผ ์ฌ์ฉ๋๋ ๊ฒฝํฅ์ ๋ํด์ ํ์คํ ๊ฒฝ๊ณ๊ฐ ํ์ํ๋ค๋ ์ด์ผ๊ธด๋ฐ, ๊ฒฐ๊ณผ๋ง ์ทจํด๋ ๋ ๊ฒ ๊ฐ๊ธฐ๋ ํฉ๋๋ค๋ง NeurIPS 2024 ๋ถ์๋ค๋๊ฑธ ์ด์ ์์์ใ ใ ๋์ด์ฌ๋ ค๋ด ๋๋ค.