Spotting LLMs With Binoculars: Zero-Shot Detection of Machine-Generated Text
Meta info.
- Authors: Abhimanyu Hans, Avi Schwarzschild et al.
- Paper: https://arxiv.org/pdf/2401.12070.pdf
- Affiliation: Maryland Univ.
- Code: https://github.com/ahans30/Binoculars
TL; DR
๋ณ๋ ํ์ต์ด๋ ํ๋ ์์ด ํ ์์ pretrained LLM์ผ๋ก ๊ฐ๋จํ ๊ณ์ฐ๋ง ํ๋ฉด machine generated text๋ฅผ ํ์งํด๋ด๋ ๋ฐฉ๋ฒ๋ก Binoculars ์ ์. ์์ฑ๋ sample 90% ์ด์ ํ์ง(pic1)




Suggestions
- cross-perplexity: ๊ฐ๋จํ๊ฒ M1์ probability distribution์ M2์ log PPL(pic2)์ element-wise products. ์ฆ, M1์ ์์ธก์ด M2์ ์ํด ์ด๋ป๊ฒ ํ๋จ๋๋์ง(how surprising) weighting ํ๋ ๋ฐฉ์. (pic3)
- e.g. M1์ด ์ด๋ token์ ๋์ ํ๋ฅ ๋ก ์์ธกํ์ง๋ง, M2๋ ๋ฎ์ PPL์ ์ฃผ๋ฉด(log PPL ์ ์ปค์ง๋), ๊ฒฐ๋ก ์ ์ผ๋ก cross-perplexity ๊ฐ์ ๋์์ง๊ณ , ์ด๋ ๊ณง M2 ์ ์ฅ์์๋ M1์ ์์ธก์ด โsurprisingโ
- Binoculars score (B): perplexity๋ฅผ crosss-perplexity nomalizationํ ๋ฒ์ . (pic4)