1 minute read

Meta info.

TL; DR

ν•„μˆ˜μ μΈ 쀑간 μΆ”λ‘ λ§Œ μ΅œμ†Œν•œμœΌλ‘œ 생성, 토큰 μ‚¬μš©κ³Ό μΆ”λ‘  μ‹œκ°„μ„ 크게 μ€„μ΄λŠ” ν”„λ‘¬ν”„νŒ… 방식 CoD μ œμ•ˆ

image.png

image.png

image.png

image.png

image.png

image.png

Background

CoT 이후 μ–‘μ‚°λœ λ‹€μ–‘ν•œ ν”„λ‘¬ν”„νŒ… 방식 λ°œμ „λ¨

  • ꡬ쑰적으둜 tree-based or graph-basedλ‚˜
  • Self-consistency β†’ majority voting λ“±

Problem States

CoT-style ν”„λ‘¬ν”„νŒ…μ€ latency λ“± μΆ”λ‘  λΉ„μš© λ¬Έμ œμ—μ„œ λΉ„νš¨μœ¨μ  (경제적, μ‹œκ°„μ )

  • SoT: 병렬디코딩 (κ·Έλ ‡λ‹€κ³  λΉ„μš©μ΄ μ€€ 것은 μ•„λ‹˜)
  • CCoTλ‚˜ TALE(μ˜ˆμ‚°κΈ°λ°˜ μ œμ•½): optimal은 μ•„λ‹˜
  • Research Question: μ΅œμ†Œν•œμ˜ λ‹¨κ³„λ‘œλ„ 높은 정확도λ₯Ό μœ μ§€μ‹œν‚¬ 수 μžˆλŠ” ν”„λ‘¬ν”„νŒ… μ „λž΅μ΄ μ—†μ„κΉŒ

Suggestions

Chain-of-Draft(CoD)

  • μΈκ°„μ˜ 사고 κ³Όμ • (인간이 λ³΅μž‘ν•œ λ¬Έμ œμ—μ„œ 핡심 μ •λ³΄λ§Œ κ°„λž΅νžˆ 뽑아내듯)μ—μ„œ μ°©μ•ˆ
  • 쀑간 μΆ”λ‘  과정을 κ°€μž₯ μ€‘μš”ν•œ μ •λ³΄λ§Œ ν¬ν•¨ν•˜λŠ” β€œμ΄ˆμ•ˆ(draft)” ν˜•μ‹μœΌλ‘œ κ°„κ²°ν•˜κ²Œ ν‘œν˜„ (pic2Β μ°Έκ³ )
    • CoD μ˜ˆμ œμ—μ„œλŠ” κ°€λŠ₯ν•œν•œΒ κ° reasoning step을 μ΅œλŒ€ 5단어 μ΄λ‚΄λ‘œ 쀄이도둝 μ§€μ‹œ
  • μ˜ˆμ‹œ:Β β€œJason은 사탕 20개λ₯Ό κ°–κ³  μžˆμ—ˆλŠ”λ° Dennyμ—κ²Œ λͺ‡κ°œ μ£Όκ³  12개 λ‚¨μŒ. λͺ‡ 개 μ€¬μ„κΉŒ?”
    • standard prompting: 8 (reasoning μ—†μŒ)
    • CoT prompting: ꡬ체적으둜 step λ°Ÿμ•„μ„œ reasoning
    • CoD prompting: 20 - x = 12; x = 20 - 12 = 8 (핡심 μˆ˜μ‹μœΌλ‘œ ν‘œν˜„)

Effects

  • Experiments setup
    • backbone: GPT-4o, Claude 3.5 Sonnet
    • prompting: standard, CoT, CoD
    • tasks: GSM8K (μˆ˜λ¦¬μΆ”λ‘ ) / BIG-Bench (상식좔둠) / CoinFlips
  • Results
    • fsμ—μ„œ 토큰을 80% κ°€λŸ‰ μ€„μ΄λ©΄μ„œλ„ μ •ν™•λ„λŠ” 거의 μœ μ§€λ˜κΈ΄ ν•˜λŠ”λ°, 항상 잘 λ¨ΉνžˆλŠ” ν”„λ‘¬ν”„νŒ…μ€ μ•„λ‹˜.
      • zsμ—μ„œ μ„±λŠ₯ 크게 ν•˜λ½
      • 3B μ΄ν•˜ λͺ¨λΈμ€ CoT보닀 λͺ»ν•˜κ³ 
      • BIG-benchμ—μ„œλŠ” 항상 λ² μŠ€νŠΈλŠ” μ•„λ‹ˆμ—ˆμŒ: λ„ˆλ¬΄ 짧은 μš”μ•½μ΄ ν•΄κ°€ 된 λ“―

Personal note. νŽ˜μ˜€λ°κ°μ€ μ•„λ‹ˆμ§€ μ‹Άμ§€λ§Œ, μ΅œμ‹  ν”„λ‘¬ν”„νŒ… λ…Όλ¬Έ κΆκΈˆν•΄μ„œ μ°λ¨Ήν–ˆλŠ”λ° μ˜ˆμƒλŒ€λ‘œ 별닀λ₯Έ μ•„μ΄λ””μ–΄λŠ” μ•„λ‹ˆμ—ˆλ˜ 것 κ°™κ³ , κ°„κ²°ν•˜κ²Œ ν‘œν˜„λ˜μ§€ μ•ŠλŠ” 좔둠에 λŒ€ν•΄μ„œ μ„±λŠ₯이 일관적이지 μ•Šλ‹€λŠ” 뢀뢄도 λ‹Ήμ—°ν•œ 흐름인 것 κ°™μŠ΅λ‹ˆλ‹€. fs은 λŒ€μΆ© 8-16 이지 μ‹Άλ„€μš”.