Questioning the Survey Responses of Large Language Models
Meta info.
- Authors: Ricardo Dominguez-Olmedo, Moritz Hardt, Celestine Mendler-Dรผnner
- Paper: https://openreview.net/pdf?id=Oo7dlLgqQX
- Published: September 26, 2024
- Conference: NeurIPS2024
TL; DR
labeled ์๋ต์ ์ ํํ๊ฒ ํ๋ ๋ฌธ์ (=survey)์์, ๊ทธ ์์ ๋ฌด์์๋ก ์ฃผ๋ฉด ์๋ต๋ ๊ฒฐ๊ตญ ๋ฌด์์์ ๊ฐ๊น๋๋ผ






Background
๊ด๋ฒ์ํ ๋ถ์ผ์์ LLM์ Survey ๋๊ตฌ๋ก ์ ๊ทน์ ์ผ๋ก ํ์ฉ
Problem States
LLM์ ์ค๋ฌธ ์๋ต์ ๋ํ ํธํฅ ๊ฐ๊ณผ
Suggestions
๋ฏธ๊ตญ ์ธ๊ตฌ ์กฐ์ฌ๊ตญ์ ๋ฏธ๊ตญ ์ง์ญ์ฌํ ์กฐ์ฌ(ACS) ๊ธฐ๋ฐ, ํ์ค ํ๋กฌํํธ(pic2) ์ฌ์ฉํ์ฌ 43๊ฐ์ LLM ํ๊ฐ
Effects
- results:
- ๋ชจ๋ธ ์๋ต์ด ์์/label์ ํธํฅ (e.g.ย
A๋ก ํ์๋ ์๋ต์ ํธํฅ,ยFigure 3) - ์์ ๊ฒฐ๊ณผ์ ๋ฐ๋ผ ์์๋ฅผ ๋๋ค์ผ๋ก ์์ผ๋ฉด LLM์ด scale์ด๋ pre-training data size ๋ฌด์ํ๊ณ ๊ท ์ผํ๊ฒ randomํ ์๋ต ํด๋ฒ๋ฆผ (
Figure 4) - LLM์ ๋ณด๋ ค๋ Survey์ ์ด ํต๊ณ๊ฐ uniform์ ๊ฐ๊น์ด subgroups์ (๊ฐ์ฅ) ๋ ์๋ํ๋ด๊ณ , ์ด์ ๋ฐ๋ผ ๋ชจ๋ธ alignment์ ๋ํ ์๋ชป๋ ํด์์ผ๋ก ์ฐ๊ฒฐ๋ ๋ฌธ์ ๊ฐ ์๋ค. (
Figure 5/6)
- ๋ชจ๋ธ ์๋ต์ด ์์/label์ ํธํฅ (e.g.ย
Personal note. ๋น์ฐํ ๊ฒ ๊ฐ๊ธฐ๋ ํ๋ฐ labeled ์๋ต์ ์ ํํ๊ฒ ํ๋ ๋ฌธ์ (=survey)์์, ๊ทธ ์์ ๋ฌด์์๋ก ์ฃผ๋ฉด ์๋ต๋ ๊ฒฐ๊ตญ ๋ฌด์์์ ๊ฐ๊น๋๋ผ๋ ์๊ธด๋ฐ, ํ์คํ LLM์ ์ฐ๊ตฌํ์ง ์๋ ์ผ๋ฐ ์ฌ์ฉ์๊ฐ ๊ฐ๊ณผํ ์ ์๋ ํธํฅ์ ๋ํด์๋ ๊ฒฝ๊ณํด๋ด์ง ํ๋ค์. ์ฐ๋ฆฌ๋ ์ ์ง ์ฃผ๊ณ ๊ณ ๋ฅด๊ฒ ํ๋ ๋ฌธ์ ๋ฅผ ํ ๋ ์ ๋ ํ๋๊ฒ ์ข์ ๊ฒ ๊ฐ์์. ๋ํ ์ผ๋ณด๋ค๋ ๊ฒฐ๋ก ๋ง ์ทจํด๋ ๋ ๊ฒ ๊ฐ์ต๋๋ค.