Do Large Language Model Understand Multi-Intent Spoken Language ?
Meta info.
- Authors: Shangjian Yin, Peijie Huang, Yuhong Xu, Haojing Huang, Jiatian Che
- Paper: https://arxiv.org/pdf/2403.04481
- Affiliation: SCAU, Tsinghua Univ.
- Published: March 7, 2024
TL; DR
SLU(Spoken Language Understanding)์ ๋ํ LLM ํ์ฉ ์ฐ๊ตฌ๋ฅผ ์ํ LM-MixATIS, LM-MixSNIPS ๋ฒค์น๋งํฌ ๋ฐ metric ์ ์


Problem States
- LLM์ด multi-intent SLU์ ๋ํด ๊ธฐ์กด์ SOTA๋ชจ๋ธ๊ณผ ๋น๊ตํ ์ฑ๋ฅ์ ์ด๋ ํ๊ฐ?
- multi-intent SLU: multi-intent detection + (entity) slot-filling
- LLM ๊ท๋ชจ๊ฐ ์ฑ๋ฅ์ ์ํฅ์ ๋ฏธ์น๋๊ฐ?
- LLM์ ํ์ฉํ SLU์ ์ ํฉํ metric์?
Effects
- Experiment
- model: QLoRA-tuned LLM ์ฌ์ฉ, task-specific fine-tuning ํ์ํ๋ค๊ณ ์ธ๊ธ
- datasets: LM-MixX(sub-intent instruction ํฌํจ) ์ ์ฉ
- sub-intent instructions: ๋ฐํ์์ ๊ฐ intent๋ณ๋ก ํด๋นํ๋ entity ์ถ์ถ >slot-filling ์ผ๋ก ์ฐ๊ฒฐ
- prompt: pic1 ์ฐธ๊ณ
- metric: Accuracy for ID, F1 for SF, Overall Accuracy + ESA, CSA ์ ์
- ESA: entity๋ฅผ ์ผ๋ง๋ ๋ง์ท๋์ง
- CSA: Accuracy for ID * ESA
- Results
- LM-MixX ๋ฐ์ดํฐ์ ๊ณผ ์ ์๋ ํ๋กฌํํธ๋ผ๋ฉด LLM ์ฑ๋ฅ ์ถฉ๋ถํ supervised-SOTA ์ด์์ผ๋ก ์ข๋ค
- ๋ค๋ง ๋ชจ๋ธ ํฌ๊ธฐ๊ฐ ํฌ๋ค๊ณ ๋ฐ๋์ ์ฑ๋ฅ์ด ์ข์๊ฒ์ ์๋๋ค (MixATIS)
- ESA, CSA๋ ๋ ์๊ฒฉํ๊ฒ SF๋ฅผ ํ๊ฐํ๋ฏ๋ก ์ ๋ฐ์ ์ธ SLU์ ๋ ๊ฐ์ ๋ metric์ด๋ค