Social Learning: Towards Collaborative Learning with Large Language Models
Meta info.
- Paper: https://arxiv.org/pdf/2312.11441
- Affiliation: Google
- Published: February 8, 2024
TL; DR
Social Learning์ผ๋ก๋ถํฐ ์ฐฉ์, LLM(Teacher)์ด ๋ค๋ฅธ AI๋ชจ๋ธ(Students)์ ๊ฐ๋ฅด์น๋ ๊ตฌ์กฐ ์ ์, ์ฑ๋ฅ๋ฉด์์ ์ฐจ์ด ์์ด ์์ ์ฑ ์ฆ๊ฐ



Background
- Social Learning(์ฌํํ์ต์ด๋ก ): Albert Bandura, ์ธ๊ฐ์ ๋๊ตฐ๊ฐ์ ํ๋์ ๊ด์ฐฐํ๊ณ ๊ทธ๊ฒ์ ๋ชจ๋ฐฉํจ์ผ๋ก์จ ์๋ก์ด ํ๋์ด๋ ์ง์์ ์ต๋ํ๋ค
- e.g., ๋ฏผ๊ฐ์ ๋ณด๋ฅผ ๋ชจ๋ ํฌํจํ์ฌ ํ์ตํ LLM์ด ๋ฏผ๊ฐ์ ๋ณด๊ฐ ํฌํจ๋ input์ ๋ฐ์์ ๋, input์์ ๋ฏผ๊ฐ์ ๋ณด๋ฅผ ์ง์ฐ๊ณ ๊ฐ์์ ์ ๋ณด๋ฅผ ์์ฑ, ์ ํฉํ ์ฌ๋ก๋ฅผ ๊ณจ๋ผ Inference ๋จ๊ณ์ ํ์ ์์ด์ ํธ์๊ฒ ํ๋กฌํํธ๋ฅผ ์ ๋ฌ โ ๊ฐ์ธ์ ๋ณด ์ ์ถ๋ฌธ์ ํํผ
Suggestion
- Teacher: LLM์ด instruction์ ์์ฑํ๊ฑฐ๋ LLM์ด ์์ ์ private data๋ฅผ ์ํ๋งํด์ example์ ์์ฑ
- Student: ์ด๋ฅผ ๊ฒฐํฉํ prompt ์ฌ์ฉ
Effect
social learning ๋ฐฉ์์ ์ ์ฉํด๋ ์ฑ๋ฅ์ ํฐ ์ฐจ์ด๊ฐ ์์๋ฟ๋ง ์๋๋ผ LLM์ ๊ฑฐ์ณ์ ๋ค๋ฅธ AI ๋ชจ๋ธ์ ์ ๋ฌํ๋ ๊ฒ์ด ๋ ์์ ํ๋ค.
- ์ผ์ข
์ ๋ฐ์ ๋ Federated Learning: ๋ฐ์ดํฐ ํ์ค์ํ. ์๋ณธ ๋ฐ์ดํฐ๊ฐ ์ค์ํ๋ ์๋ฒ์ ์ ๋ฌ๋์ง ์๊ณ ์์ฒด์ ์ธ ๋ชจ๋ธ ๋ด์์ ์ฒ๋ฆฌ
- teacher-student๊ฐ ์๋ก ๋ค๋ฅธ ๋ชจ๋ธ ๊ตฌ์กฐ๋ฅผ ๊ฐ์ ธ๋ ์๊ด ์์
- gradient update ๋ถํ์ โ ๋์ฑ ์์ ํ๋ค๋ ์ฃผ์ฅ
- ์๋์ ์ผ๋ก ํด์ ๊ฐ๋ฅ์ฑ ์ฆ๊ฐ: gradient๋ณด๋ค generated text๊ฐ ๋ช ์์
- memorization ์ธก์ (Secret Sharer): training set์ โCanariesโ๋ฅผ ์จ๊ฒจ๋๊ณ , Canaries๊ฐ ๊ธฐ๋ฐ ๋ฐ์ดํฐ์ ์ ๊ทผํ ์ ์๋๋ก ํ ๋ค์, ๋ฐ์ดํฐ ์์ ์กด์ฌํ๋ ๊ธฐ๋ฐ์ด ์ผ๋ง๋ ๊ธฐ์ต๋๊ณ ์๋์ง๋ฅผ ์ธก์
- e.g.,ย
The secret code is 1234.๋ผ๋ ์ ๋ณด๊ฐ Canaries์ ํฌํจ๋๋ฉด, secret code๋ผ๋ ์ ์ ์ธ์์ ํ๋ย1234ย ๋ ๊ฐ๋ ค์ผ ๋๋ ์ํฉ. ์ฆ ๋ชจ๋ธ์ย1234ย ๊ฐ ์๋๋ผ secret code ๋ผ๋ ์ฌ์ค์ ๋ ์ง์คํ๋ ๊ฒ์ด ์ด์์ . - ์ผ๋ถ ์๊ธฐํ๊ธด ํ๋ ๊ฒ์ผ๋ก ๋ณด์ด๊ธด ํ์ง๋ง, ์๊ธฐํ์ง ์๋ ์์ค์ ๊ฐ๊น์ด ๊ฒ์ ํ์ธ
- e.g.,ย