Am I Me or You? State-of-the-Art Dialogue Models Cannot Maintain an Identity
- Authors: Kurt Shuster, Jack Urbanek, Arthur Szlam, Jason Weston
- Paper: https://aclanthology.org/2022.findings-naacl.182.pdf
- Affiliation: Facebook AI Research
- Published: December 10, 2021
TL; DR
์ต์ ๋ํ ๋ชจ๋ธ์ ์ข
์ข
์ ์ฒด์ฑ์ ์ ์งํ์ง ๋ชปํ๋ฉฐ, expanded attention & classifier-based reranking์ผ๋ก ์ค๋ฅ๋ฅผ 65% ์ค์ผ ์ ์์ผ๋ ์ฌ์ ํ challenge์ด๋ค.

Background
- ๋๊ท๋ชจ open-domain dialogue system (๋น์ facebook์ BlenderBot, Google์ Meena ๋ฑ)์ fluency ์ engagement๋ฅผ ํฌ๊ฒ ํฅ์์์ผฐ์ผ๋,
- persona-conditioned models๋ role ์ ์ง ์ธก๋ฉด์์ ์ฌ์ ํ ๋ชจ์, ๋ฐ๋ณต, ํ๊ฐ ํ์ ๋ฐ์.
- ๋์ฒด๋ก factual consistency, grounding, contradiction detection๋ฑ์ ์ฐ๊ตฌ๊ฐ ์ฃผ๋ฅ๋ก, identity consistency๋ ์์ง ์ด๊ธฐ๋จ๊ณ
Problem States
๋ชจ๋ธ์ด ์ด๋ป๊ฒ ํ๋ฉด ์๊ธฐ ์ค์ค๋ก์ ๋ํ ์ ์ฒด์ฑ์ ์ ์งํ ์ ์์๊น
- ๋ํ ์์ด์ ํธ๋ ์ข
์ข
โinterlocutor์ identity๋ฅผ ์ทจํ๋คโ; ์๋ ์ญํ ์ ์๊ธฐ ๊ฒ์ผ๋ก ์ฐฉ๊ฐํ๋ค
- guest ์ญํ model์ด ๊ฐ์๊ธฐ thief๋ hunter๋ผ๊ณ ์ฃผ์ฅํ๋ ๊ฒฝ์ฐ
tab 1 - LIGHT์์ ์ธ๊ฐ์ ์บ๋ฆญํฐ๋ฅผ ์ ์ง(1.34% ์ค๋ฅ)ํ๋, ๋ชจ๋ธ์ ์ฝ 35%์์ ์คํจ
- LIGHT:
- ์ ์ฒด์ฑ ์ ์ง==turn์ด ์ง๋๋ฉด์๋ ์์ /์๋๋ฐฉ ์ญํ ์ค์ธํ์ง ์๋๋ก
- guest ์ญํ model์ด ๊ฐ์๊ธฐ thief๋ hunter๋ผ๊ณ ์ฃผ์ฅํ๋ ๊ฒฝ์ฐ
Suggestions
identity ์ฐฉ๋ ์ํ ๋ฐฉ์
- RPA ๊ธฐ๋ฐ reranking
- RPA classifier: Poly-encoder Transformer ๊ธฐ๋ฐ ๋ฐํ๊ฐ ์ฃผ์ด์ง ์บ๋ฆญํฐ ์ ์ฒด์ฑ์ ๋ถํฉํ๋์ง ํ๋ณํ๋ ๋ชจ๋ธ
- motivation: ์ด๋ค ๋ฐํ๊ฐ ์ด๋ค ํ๋ฅด์๋/์บ๋ฆญํฐ๊ฐ ํ ๋ฒํ ๋ง์ธ์ง ํ๋ณํ ์ ์๋ ์๋๊ณ์ฐ metric์ด ์๋ค๋ฉด ํ๋ จํ ๋๋ ํ๊ฐํ ๋ ์ธ ์ ์์ง ์์๊น = RPA classifier ํ์ต
- ๋ฐฉ๋ฒ:
- LIGHT ๋ํ์ context๋ฅผ ๋ฐ์๋ค๊ฐ (์บ๋ฆญํฐ ์ด๋ฆ, persona, ์ฅ์ ๋ฑ + ๋ํ history)
- ๋ชจ๋ธ์ด ์์ฑํ candidate๋ฅผ ๋ณด๊ณ ์ด๋ค ์บ๋ฆญํฐ ๋ฐํ์ ๊ฐ์ฅ ์ ํฉํ์ง ํ๋จ = ๋ถ๋ฅ๋ฌธ์
- negative sampling: ์ ๋ต ์บ๋ฆญํฐ + 99๊ฐ ๋๋ค ์บ๋ฆญํฐ ํ๋ณด ์ค์์ ๋ง์ถ๋๋ก ํ์ต
- option: full or token
tab 2- ์ ์ฒด ๋ฐํ ๊ธฐ๋ฐ RPA(full)
- Left-to-Right RPA(token): ํ ํฐ๋จ์๋ก ์์ฑ๋ ๋์ค์ ๊ทธ ์์ ๊น์ง๋ง ๋ณด๊ณ ์ด๋ ํ์์ธ์ง ๋ง์ถฐ๋ณด๊ธฐ
- e.g.,
tab 11Hey there mermaid! <- ๊น์ง ๋ณด๊ณ ๋๋ฉด ๊ฐ์๊ธฐ Mermaid ์บ๋ฆญํฐ์ ๋ํ ํ๋ฅ ์ฆ๊ฐ (ํธ์นญ์ธ์ง ์๊ธฐ์๊ฐ์ธ์ง ํ ํฐ๋จ์๋ง์ผ๋ก๋ ํ์ ๋ชป๋ง์ถ๋ ๊ฒฝํฅ ํ์ธ)
- reranking: ๋ชจ๋ธ์ด ์ฌ๋ฌ ํ๋ณด ์๋ต์ ์์ฑํ๋ฉด, ๊ทธ์ค์์ RPA ์ ์๊ฐ ๊ฐ์ฅ ๋์ ๊ฑธ ์ฐ์
- ๋ฐํ๋จ์ re-ranking (utt, full): ๊ฐ์ฅ in-characterํ ๊ฑธ ์ ํ
- PACER(token): ์์ฑ ๋์ค๊น์ง๋ง ๋ณด๊ณ RPA ์ ์ ๋์๊ฑธ ์ฐ๋๋ฐ
- ๋งค ํ ํฐ๋ง๋ค ํ ์๋ ์์ผ๋ (์๋์ธก๋ฉด ํ๊ณ)
- ์ผ๋ถ ์คํ
(์์๋ก ์ ์ฒด ํ ํฐ ์์น์ 5% or 33%๋ง)์์ (๊ฒฝํ์ ์ผ๋ก ์คํํด์ ๊ฒฐ์ ๋จ,
tab 3) - ์์์ ํ๋ณด(์ด์ ์์ฑ + top-10 token)์ ๋ํด์๋ง RPA ๊ณ์ฐ โ reranking
- RPA classifier: Poly-encoder Transformer ๊ธฐ๋ฐ ๋ฐํ๊ฐ ์ฃผ์ด์ง ์บ๋ฆญํฐ ์ ์ฒด์ฑ์ ๋ถํฉํ๋์ง ํ๋ณํ๋ ๋ชจ๋ธ
- unlikelihood: ์์ฑ ํ๋ณด์ ๋ํด RPA๋ก ๊ณจ๋๋๋ฐ ์ ๋ต์ด ์๋์์ ๊ฒฝ์ฐ์ ๋ํด ํจ๋ํฐ ๋ถ์ฌํ๋ ๋ณด์กฐ Loss ์ค๊ณ
- multi-objective learning: Next token prediction + ๋๊ตฌ ๋ฐํ์ธ๊ฐ ๊ฐ์ด ํ์ต (joint learning loss)
- expanded attention: ๋์ฝ๋๊ฐ ํญ์ ์๊ธฐ persona ๋ค์ ๋ณด๋๋ก re-attention๊ฐ์ ํ๊ธฐ (cross-attention ๋จ๊ณ)
- persona grounding(์๋ ์ ํ): A ์๊ธฐ ํ๋ฅด์๋, B ์๊ธฐ ์ด๋ฆ, C ์๋ ์ด๋ฆ, D ๋ฐฐ๊ฒฝ ์ค์ ์ ๋ฌถ์ด persona subset ๋ง๋ ๋ค expanded attention์ผ๋ก ๋ค์ ๋ณด๊ฒ ํ๊ธฐ = ABCD ๋ค ๋ณด๊ณ 2ํ ๋ฐ๋ณตํ์ ๋ ๊ฐ์ฅ ์ข์ ์ฑ๋ฅ
- automated grounding(์๋ ์ ํ): Decoder-attn ๊ธฐ๋ฐ / Trainable mask(๋ณ๋ก์๋ค๊ณ ) ํน์ RPA attention ํ์ฉ (์๋ ์ ํ์ด๋ ๋น์ท,
tab 7)- ์ฆ, ์๋ ์ ํ์ ์ํ persona ๊ฐ์ meta ์ ๋ณด๊ฐ ์์ผ๋ฉด attention ํ์ฉํ๋ฉด ๋ ๊ฒ
Effects
tab 4 main table; expanded attention+reranking ์กฐํฉ์ด ์ต์
Personal note. memory conflict ๊ด๋ จํด์ ๋ณด๋ ํ์ดํผ ๋ฆฌ์คํธ์์ ์ฐธ๊ณ ํด์ ํ์ธํ์ต๋๋ค. ์ํ ๋ฐฉ๋ฒ์ด ๋ค์ํ๊ณ ablation์ด ์ ๋ ๊ฒ ๊ฐ๊ธฐ๋ ํ๋ฐ ๋ฐฉ์ ์์ฒด๊ฐ ํ์ฌ์ LLM์ ์ ์ฉํ๋ ๋ฐฉ์์ผ๋ก ์ ๊ทผํ๊ธฐ์๋ ๋ค์ ์กฐ์กํ๊ณ , ๊ทธ ๋ฐฉ์์ ํ๊ณ๋ ๋๋ฌด ๋น์ฐํ ๋ฐ์๋ ๊ฒ ๊ฐ์ ํ๋ฆ์ด์, ๊ฒ์ฆ๋ ๊ฒฐ๊ณผ ์ญ์ ๋งค์ฐ ๊ฒฝํ์ ์ธ ๋ถ๋ถ์ ๊ธฐ๋๊ณ ์๋ ๋ฑ ๋์ฒด๋ก findings์ธ ์ด์ ๊ฐ ๋ช ๋ฐฑํด๋ณด์ด๊ธฐ๋ ํฉ๋๋ค. (๊ฒฐ๋ก ์ ๋๋ง ์ทจํด๋ ์ข์ ๊ฒ ๊ฐ์์ ์คํ ๊ฒฐ๊ณผ๋ฅผ ํฌ๊ฒ ์๋ตํ์ต๋๋ค.) ๋ค๋ง ๋ฌธ์ ์ ๊ธฐ๋ ํ์คํ๊ณ ๋ณด๋ ค๊ณ ํ๋ ๋ฐฉํฅ๊ณผ ์ ์ฌํ๋ค๋ ์ ์ด ์ธ์๊น์๊ณ (ํธ์นญ์ ํ์๋ก ์ฐฉ๊ฐํ๋ค๋ ์ ์ ๊ตฌ์ฒด์ ์ผ๋ก ํ์ธํด๋ธ ์ ), ์ด ๋ฌธ์ ๋ฅผ ์ถ์ ํ๊ณ ์๋ ์ฐ๊ตฌ๊ฐ ์๋์ง ๋ง์ ์ดํด๋ณด๊ณ ์์ง๋ง, ๋น์ฐํ๋ ๋งค์ฐ ์ข์ ๋ฌธ์ ๋ฅผ ๋ค๋ฃจ๊ณ ์๊ธฐ ๋๋ฌธ์ ์ด๋ฅผ ์ง์คํ๋ค๊ณ ๋ณด๊ธด ์ด๋ ค์ธ ๊ฒ ๊ฐ์ต๋๋ค.