less than 1 minute read

Meta info.

TL; DR

labeled ์‘๋‹ต์„ ์„ ํƒํ•˜๊ฒŒ ํ•˜๋Š” ๋ฌธ์ œ(=survey)์—์„œ, ๊ทธ ์ˆœ์„œ ๋ฌด์ž‘์œ„๋กœ ์ฃผ๋ฉด ์‘๋‹ต๋„ ๊ฒฐ๊ตญ ๋ฌด์ž‘์œ„์— ๊ฐ€๊น๋”๋ผ

image.png

image.png

image.png

image.png

image.png

image.png

Background

๊ด‘๋ฒ”์œ„ํ•œ ๋ถ„์•ผ์—์„œ LLM์„ Survey ๋„๊ตฌ๋กœ ์ ๊ทน์ ์œผ๋กœ ํ™œ์šฉ

Problem States

LLM์˜ ์„ค๋ฌธ ์‘๋‹ต์— ๋Œ€ํ•œ ํŽธํ–ฅ ๊ฐ„๊ณผ

Suggestions

๋ฏธ๊ตญ ์ธ๊ตฌ ์กฐ์‚ฌ๊ตญ์˜ ๋ฏธ๊ตญ ์ง€์—ญ์‚ฌํšŒ ์กฐ์‚ฌ(ACS) ๊ธฐ๋ฐ˜, ํ‘œ์ค€ ํ”„๋กฌํ”„ํŠธ(pic2) ์‚ฌ์šฉํ•˜์—ฌ 43๊ฐœ์˜ LLM ํ‰๊ฐ€

Effects

  • results:
    • ๋ชจ๋ธ ์‘๋‹ต์ด ์ˆœ์„œ/label์— ํŽธํ–ฅ (e.g.ย A๋กœ ํ‘œ์‹œ๋œ ์‘๋‹ต์— ํŽธํ–ฅ,ย Figure 3)
    • ์•ž์„  ๊ฒฐ๊ณผ์— ๋”ฐ๋ผ ์ˆœ์„œ๋ฅผ ๋žœ๋ค์œผ๋กœ ์„ž์œผ๋ฉด LLM์ด scale์ด๋‚˜ pre-training data size ๋ฌด์‹œํ•˜๊ณ  ๊ท ์ผํ•˜๊ฒŒ randomํ•œ ์‘๋‹ต ํ•ด๋ฒ„๋ฆผ (Figure 4)
    • LLM์€ ๋ณด๋ ค๋Š” Survey์˜ ์ด ํ†ต๊ณ„๊ฐ€ uniform์— ๊ฐ€๊นŒ์šด subgroups์„ (๊ฐ€์žฅ) ๋” ์ž˜๋‚˜ํƒ€๋‚ด๊ณ , ์ด์— ๋”ฐ๋ผ ๋ชจ๋ธ alignment์— ๋Œ€ํ•œ ์ž˜๋ชป๋œ ํ•ด์„์œผ๋กœ ์—ฐ๊ฒฐ๋  ๋ฌธ์ œ๊ฐ€ ์žˆ๋‹ค. (Figure 5/6)

Personal note. ๋‹น์—ฐํ•œ ๊ฒƒ ๊ฐ™๊ธฐ๋„ ํ•œ๋ฐ labeled ์‘๋‹ต์„ ์„ ํƒํ•˜๊ฒŒ ํ•˜๋Š” ๋ฌธ์ œ(=survey)์—์„œ, ๊ทธ ์ˆœ์„œ ๋ฌด์ž‘์œ„๋กœ ์ฃผ๋ฉด ์‘๋‹ต๋„ ๊ฒฐ๊ตญ ๋ฌด์ž‘์œ„์— ๊ฐ€๊น๋”๋ผ๋Š” ์–˜๊ธด๋ฐ, ํ™•์‹คํžˆ LLM์„ ์—ฐ๊ตฌํ•˜์ง€ ์•Š๋Š” ์ผ๋ฐ˜ ์‚ฌ์šฉ์ž๊ฐ€ ๊ฐ„๊ณผํ•  ์ˆ˜ ์žˆ๋Š” ํŽธํ–ฅ์— ๋Œ€ํ•ด์„œ๋Š” ๊ฒฝ๊ณ„ํ•ด๋ด„์ง ํ•˜๋„ค์š”. ์šฐ๋ฆฌ๋„ ์„ ์ง€ ์ฃผ๊ณ  ๊ณ ๋ฅด๊ฒŒ ํ•˜๋Š” ๋ฌธ์ œ๋ฅผ ํ’€ ๋•Œ ์œ ๋…ํ•˜๋Š”๊ฒŒ ์ข‹์„ ๊ฒƒ ๊ฐ™์•„์š”. ๋””ํ…Œ์ผ๋ณด๋‹ค๋Š” ๊ฒฐ๋ก ๋งŒ ์ทจํ•ด๋„ ๋  ๊ฒƒ ๊ฐ™์Šต๋‹ˆ๋‹ค.

Categories: