Self-Discover: Large Language Models Self-Compose Reasoning Structures
Meta info.
- Authors: Pei Zhou, Jay Pujara, Xiang Ren, Xinyun Chen, Heng-Tze Cheng, Quoc V. Le, Ed H. Chi, Denny Zhou, Swaroop Mishra, Huaixiu Steven Zheng
- Paper: https://arxiv.org/pdf/2402.03620.pdf
- Affiliation: Google DeepMind, USC
- Published: February 6, 2024
TL; DR
๋ธ์ด ์ฌ๋ฌ reasoning techniques(CoT, critical thinking, ...) ์ค์์ ํ๋๋ฅผ ์ค์ค๋ก ์ ํํ์ฌ task๋ณ๋ก ์ ํฉํ ์ถ๋ก ์ ๋ต์ ๊ตฌ์ฑํ๋๋ก ํ๋ ํ๋ ์์ํฌ ์ ์. BBH์์ ๋จ์ CoT๋ณด๋ค ์ฑ๋ฅ์ด ์ข๊ณ CoT Self-consistency๋ณด๋ค๋ ์ถ๋ก ์ฐ์ฐ์ด 10~40x ๋ ๋ ๋ค๊ณ . sLLM์์ ๋ ์๋๋ค๊ณ ์ธ๊ธ.



Suggestions
- stage1: task level์์ ์ถ๋ก ๊ตฌ์กฐ ์ ํ. ์ ์ฒด key-value format ์์ฑ
- 3๊ฐ์ง meta-prompt
- select: proper framework (CoT, critical thinking, โฆ)
- adapt:ย rephrase for specific task
- implement: actionable to fill the values
- 3๊ฐ์ง meta-prompt
- stage2: value-filling ํฌ๋งท์ผ๋ก instance level solving
Personal note. ์ฌ์ ํ์ต์ด๋ label์ ์ฃผ์ง ์๋ ์ ์ด orca ํ์ต๋ฐฉ์๊ณผ ์ฐจ์ด์ธ ๋ฏ ํฉ๋๋ค.(Orca๋ ์์ ๋ชจ๋ธ instruction tuningํ ๋ ์ด๋ค instruction์ ์ค ์ง ๋ชจ๋ธ์ด ์ ํํ๊ฒ ํ๋ ๊ฑฐ์๊ณ , self-discover๋ ๋น์ทํ ๋ฐฉ์์ icl์์ ์ ๊ทผ.)