ChatQA: Building GPT-4 Level Conversational QA Models

January 19, 2024 less than 1 minute read

Meta info.

Authors: ihan Liu, Wei Ping, Rajarshi Roy, Peng Xu, Mohammad Shoeybi, Bryan Catanzaro
Paper: https://arxiv.org/abs/2401.10225
Affiliation: NVIDIA

TL; DR

LLM zero-shot에서 대화꼴 QA 성능을 크게 개선할 수 있는 2-stage instruction tuning 방법 제안.

Untitled

stage 1: multi-turn 대화데이터로 SFT
stage 2: 맥락이 주어지는 QA 벤치마크 데이터로 instruction tuning
retrieval for multi-turn QA: 대화가 길어진 경우, 직전 발화와 대화 이력을 인코딩해서 관련 대화 부분을 찾아온다고. (pic2)