Zero-Shot Cross-Domain Dialogue State Tracking via Dual Low-Rank Adaptation
Meta info.
- Authors: Xiang Luo, Zhiwen Tang, Jin Wang, Xuejie Zhang
- Paper: https://arxiv.org/pdf/2407.21633
- Affiliation: Yunnan University
- Code: https://github.com/suntea233/DualLoRA
- Conference: ACL2024
TL; DR
multi-layer๊ตฌ์กฐ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํ transformer ๊ณ์ด ๋ชจ๋ธ์์ prompt๊ฐ ๋ค์ชฝ์ผ๋ก ๊ฐ์๋ก ์ํ์ง๋ ๋ฌธ์ ๋ฅผ ์ํํ๋ DualLoRA ์ ์




Problem States
DST์ ๋น์ฉ์ง์ฝ์ ์ธ ๋ฐ์ดํฐ ๋ ์ด๋ธ๋ง์ด๋ tuning ์์ด ๋ฏ์ ๋๋ฉ์ธ ์ฒ๋ฆฌ์ ์ด๋ ค์.
Suggestions
DualLoRA(pic1ย pic3) ์ ์ โ prompt ์ํฅ ๋ณ๋๋ก ๋๋ฉด์ ๋ชจ๋ธ ์ ๋ ์ด์ด์ ์ ์ฉ
- ์๋ณธ dialogue context ์ฒ๋ฆฌ LoRA: prompt + context ํตํฉ
- prompt ์ต์ ํ LoRA : ์ผ์ข ์ prompt tuning, slot prompt ์ํด ๋ฐ์๋๋ ์ด๊ธฐ ๋ ธ์ด์ฆ ์ํ ๋ชฉ์ ์ผ๋ก $B_p$๋ 0์ผ๋ก ์ด๊ธฐํ. ($A_p$๋ Gaissian)
pic2: ๋์ผํ ๋๋ฉ์ธ์ slot embedding์ ์ฐจ์ด๊ฐ ๊ฑฐ์ ์์ + ํ์ต ์ด๊ธฐ์ ํนํ ๋ชจ๋ธ์ ์ฌ์ ํ์ต ์ง์๊ณผ ์ฌ๋กฏ ์ ๋ณด๊ฐ ์ถฉ๋๋๊ธฐ ๋๋ฌธ (๋ชจ๋ธ์ด ํ๋กฌํํธ๋ฅผ ์๋ชป ํ์ตํ ์ฌ์ง)- backbone: T5-style (๊ฐ attention layer์ ๊ฒฐํฉํ๋ ๊ตฌ์กฐ)
Effects
MultiWoZ ๋ฐ SGD์์ SOTA (pic4ย )
Personal note. ์๋ง ๋๋จํ ์๋ก์ด ๋ด์ฉ์ ์๋ ์ ์๊ฒ ์ง๋ง, DST ํฌํจ ToD์ฌ์์ ํฌ์ง ์์ ๋ชจ๋ธ์ ์ ํธํ๋ ์ธก๋ฉด์์ ํนํ ์ ํจํ ์ ๊ทผ์ผ๋ก ๋ณด์ฌ์ง๋๋ค.