Exploring Persona Sentiment Sensitivity in Personalized Dialogue Generation
Meta info.
- Authors: Yonghyun Jun, Hwanhee Lee
- Paper: https://aclanthology.org/2025.acl-long.900.pdf
- Affiliation: Chung-Ang Univ.
- Published: February 17, 2025
- Code: https://github.com/imsongpasimin/PesonaSensitivity
TL; DR
LLM์ persona์ sensitivity์ ๋งค์ฐ ๋ฏผ๊ฐํ์ฌ ๋ถ์ ์ persona๋ ์ผ๊ด์ฑ ์๋ ๋ํ๋ฅผ, ๊ธ์ ์ persona๋ ๋ ์ํํ๊ณ ์ง ๋์ ์ํธ์์ฉ์ ํ๊ธฐ ๋๋ฌธ์, robustness ๊ฐ์ ์ ์ํด polarity-aware ์์ฑ ์ ๋ต ์ ์

Background
personalized dialogue์ ๋ํด prompt ์์ค์์ persona ์ฃผ์ ํ๋ ๋ฐฉ์์ผ๋ก LLM ํตํฉ ์๋ ๋ฐ์
- LLM์ด contextual sentiment์ ๋ฏผ๊ฐํ๋๋ผ
- ํน์ ํ๋ฅด์๋๋ฅผ ์ด๋ป๊ฒ ์ธ ๊ฒ์ธ๊ฐ์ ์ง์ค
Problem States
persona์ sentiment polarity์ ๋ํด์๋ ์ด๋ ํ๊ฐ?
RQ1ย LLM์ persona profile์ sentiment polarity(๊ธ์ /๋ถ์ /์ค๋ฆฝ)์ ๋ฏผ๊ฐํ ๊น?RQ2ย ์ค์ ๋ก ๋ฏผ๊ฐํ๋ค๋ฉด ์ด๋ป๊ฒ robustํ๊ฒ ํ ์ ์์๊น?
Suggestions
- Large-Scale Polarity-Aware Dialogue Analysis: DistilBERT (๊ฐ์ ๋ถ๋ฅ๊ธฐ)๋ก ConvAI2 ํ๋ฅด์๋ ๋ฌธ์ฅ์ ๊ธ์ /๋ถ์ /์ค๋ฆฝ์ผ๋ก ๋ ์ด๋ธ๋ง
- Persona-Aware Dialogue Generation Framework
- Turn-Based Generation:ย single-turn์ผ๋ก ๋ฒ๊ฐ์๊ฐ๋ฉด์ ๋
๋ฆฝ์ ์ผ๋ก ๊ฐ ํ๋กํ์ ๋ํ ์์ฑ
- ๊ฐ ํ๋กํ์ ์ถฉ์คํ๋ฉด์ negative๊ฐ ์ ์ด๋๋ ํ์ ์ํ
- (๊ธฐ์กด ์ฐ๊ตฌ) ๋ ํ๋กํ์ ๋์์ llm์ ๋ฃ๊ณ ์ ์ฒด๋ฅผ ์์ฑ์์ผฐ๋๋ฐ ์ด๋ ๊ฒ ํ๋ฉด negative์ชฝ์ด ๋ถ๊ฐ๋๊ฑฐ๋ ์๋ก ๋งํฌ์ ์ํฅ์ ๋ฐ๊ธฐ๋ ํ๋ค๊ณ
- LLaMA-3.2-3B, Qwen-2.5-3B ํ์ฉ
- ๊ฐ ํ๋กํ์ ์ถฉ์คํ๋ฉด์ negative๊ฐ ์ ์ด๋๋ ํ์ ์ํ
- Profile Ordering:ย ์
๋ ฅํ ๋ polarity confidence์ ๋ฐ๋ผ ํ๋ฅด์๋๋ฅผ ์์๋๋ก ์ ๋ ฌ
- LLM์ ์์ ๋์ค๋ ์ ๋ณด์ ๋ ํฐ ์ํฅ์ ๋ฐ๋ ๊ฒฝํฅ์ด ์์ผ๋ฏ๋ก, ๋ถ์ ์ ์ด๊ฑฐ๋ ์ค๋ฆฝ์ ์ธ ํ๋กํ์ ๋จผ์ ๋๊ณ ๊ทธ ๋ค์ ๊ธ์ ์ ์ธ ํ๋กํ ๋ฐฐ์น
- ๊ฐ์ ํํ์ด ์ฝํ๊ฑฐ๋ ์ด๋ ค์ด ํ๋กํ์ ์ด๊ธฐ ๋งฅ๋ฝ์ ๋ ์ ๋ฐ์ (๊ธ์ ์ ์ธ๊ฑด ์๋ ์ ๋ง๋๋๊น)
- ๊ฒฐ๊ณผ์ ์ผ๋ก center-out score ascending ์ฆ ๊ฐ์ฅ ์ค๋ฆฝ์ธ ๊ฒ๋ถํฐ ๋๊ณ negative์ ๊ฐ์ค์น ๋๋ ํธ์ผ๋ก ์งํ
- Sentiment-Aware Prompting(SAP):ย ๋ถ์ ์ /์ค๋ฆฝ์ ํ๋ฅด์๋ ๋ฑ ๊ฐ์ ์ด ์ฝํ ํ๋กํ์ ์ ์ฒ๋ฆฌํ๋ฅผ ์ํ Instruction ์ถ๊ฐ
Please ensure that each user's persona, especially negative or neutral personas, is well integrated into the dialogue...- ์ถ๊ฐ๋ง ํด์ค๋ coherence, consistency ๋ชจ๋ ํฅ์
- Perplexity Gap (P gap) metric ์ ์:ย GPT2-large๋ก ํ๋ฅด์๋๋ฅผ condition์ผ๋ก ํ ๋ ๋ํ์ PPL ๋ณํ๋ ์ธก์
-
$\text{P}_\text{gap} = \text{Perplexity}(D) - \text{Perplexity}(D U_1, U_2)$
-
- Turn-Based Generation:ย single-turn์ผ๋ก ๋ฒ๊ฐ์๊ฐ๋ฉด์ ๋
๋ฆฝ์ ์ผ๋ก ๊ฐ ํ๋กํ์ ๋ํ ์์ฑ
Effects
- Evaluation setup:
- metrics:
- Consistency: C score, Contradiction Ratio (Contd.), Perplexity Gap (P gap), G-eval
- Coherence: Perplexity, Q-DCE, PairEval, G-eval
- baselines: LLaMA-3.2-3B, Qwen-2.5-7B, Ministal-8B, Gemma-2-9B
- metrics:
RQ1ย LLM์ persona profile์ sentiment polarity(๊ธ์ /๋ถ์ /์ค๋ฆฝ)์ ๋ฏผ๊ฐํ ๊น? >ยTab 1- negative profile: consistency ๋์ง๋ง contradiction ์ด ๋ง๊ณ coherence ๋ฎ์์ง
- positive profile: persona๋ฅผ ์ ํ์ ์ผ๋ก ์ทจํด์ contradiction๋ ์ ๊ณ
- neutral (mixed) profile: ์ด์ค๊ฐํ ์๋ก ๋ ๋ํ ํ์ง์ด ๋ฎ๋ค๊ณ
- Polarity level์ ๋ํด
- confidence ๋์ ์๋ก ์ฑ๋ฅ U ์ ์ปค๋ธ, ์ฆ ๊ฐ์ ์ด ๊ทน์ด ๋ ์๋ก ๋ํ ํ์ง์ ๋ ์ข์์งย
Fig 3
- confidence ๋์ ์๋ก ์ฑ๋ฅ U ์ ์ปค๋ธ, ์ฆ ๊ฐ์ ์ด ๊ทน์ด ๋ ์๋ก ๋ํ ํ์ง์ ๋ ์ข์์งย
RQ2ย ์ค์ ๋ก ๋ฏผ๊ฐํ๋ค๋ฉด ์ด๋ป๊ฒ robustํ๊ฒ ํ ์ ์์๊น? coherence ๋์ >ยTab 3ยTab 4- ์ ์ ๋ฐฉ์์ฒ๋ผ turn ๋จ์๋ก ์์ฑํ๋ฉด์ profile์ order ์ฃผ๊ณ instruction ์ถ๊ฐํด์ฃผ๋ฉด ๊ฐ์ฅ ์ข์ ํจ๊ณผ
Personal note. 8์์ ๊ต๋ฅ๊ฐ ์๋ CMU ์ดํํฌ ๊ต์๋ ์ฐ๊ตฌ์ค ๋ ผ๋ฌธ์ค์ dialogue personalization ๋ฑ๊ณผ ๊ด๋ จํ ๋ ผ๋ฌธ์ด ๋์ ๋์ด์ ๋ดค์ต๋๋ค. prompt-level์ ์ ์์ด๋ผ ๋ฌด์ฒ ๋จ์ํ์ง๋ง ๊ทธ ๋จ์ํจ ๋๋ถ์ ์ค์ฉ์ ์ธ๊ฒ ๊ฐ์กฐ๋ ๊ฒ ๊ฐ๊ณ , ๋๋ฆ ํ์๋ฅผ ์ ๋ ธ๋ฆฐ ๊ฒ ๊ฐ์ต๋๋ค.