(์ค๋ช ์ถ๊ฐ) Perplexity์ BLEU ์ค์ฝ์ด์ ๋ํ ๋ณด์ถฉ ์ค๋ช
์๋ณธ ๊ฒ์๊ธ: https://velog.io/@euisuk-chung/์ค๋ช ์ถ๊ฐ-Perplexity์-BLEU-์ค์ฝ์ด์-๋ํ-์์ธ-์ ๋ฆฌ
์ฑ 19์ชฝ์ ํด๋น ์ค์ฝ์ด์ ๋ํ ์ธ๊ธ์ ์์ง๋ง, ๊ฐ์ธ์ ์ผ๋ก ์ข ๋ ์ ๋ฆฌ๊ฐ ํ์ํ๋ค๊ณ ์๊ฐํ์ฌ ์๋์ ๊ฐ์ด ์ ๋ฆฌ๋ฅผ ์ํํ์์ต๋๋ค.
Perplexity
1. Perplexity๋ ๋ฌด์์ธ๊ฐ?
- Perplexity๋ โํผ๋๋โ๋ผ๋ ๋ป์ผ๋ก, ์ธ์ด ๋ชจ๋ธ์ด ์ฃผ์ด์ง ๋ฌธ์ฅ์ ์ผ๋ง๋ ์ ์์ธกํ๋์ง๋ฅผ ์ธก์ ํ๋ ์งํ์ ๋๋ค.
- ๋ฎ์ Perplexity ๊ฐ์ ๋ชจ๋ธ์ด ์ฃผ์ด์ง ํ ์คํธ๋ฅผ ์ ์์ธกํ์์ ๋ํ๋ด๋ฉฐ, ๋์ Perplexity ๊ฐ์ ๋ชจ๋ธ์ด ํ ์คํธ๋ฅผ ์์ธกํ๋ ๋ฐ ์ด๋ ค์์ ๊ฒช์์์ ์๋ฏธํฉ๋๋ค.
- Perplexity๋ ๋ชจ๋ธ์ด ๋จ์ด๋ฅผ ์์ธกํ ๋ ํ๊ท ์ ์ผ๋ก ๊ณ ๋ คํด์ผ ํ ์ ํ์ง์ ์๋ฅผ ๋ํ๋ ๋๋ค.
- ์๋ฅผ ๋ค์ด, Perplexity๊ฐ 10์ด๋ผ๋ฉด, ๋ชจ๋ธ์ ํ๊ท ์ ์ผ๋ก ๋จ์ด ํ๋๋ฅผ ์์ธกํ๊ธฐ ์ํด 10๊ฐ์ง ์ ํ์ง๋ฅผ ๊ณ ๋ คํ๋ค๋ ์๋ฏธ์ ๋๋ค.
Source: https://towardsdatascience.com/perplexity-intuition-and-derivation-105dd481c8f3
2. Perplexity์ ์ ์
Perplexity๋ ๋ค์๊ณผ ๊ฐ์ด ์ ์๋ฉ๋๋ค:
PP(W)=P(W)โ1/NPP(W) = P(W)^{-{1}/{N}}PP(W)=P(W)โ1/N
์ฌ๊ธฐ์:
- P(W)P(W)P(W): ๋ฌธ์ฅ WWW์ ํ๋ฅ (์ธ์ด ๋ชจ๋ธ์ด ๋ฌธ์ฅ WWW๋ฅผ ์์ฑํ ํ๋ฅ )
- NNN: ๋ฌธ์ฅ WWW์ ๋จ์ด ๊ฐ์
์ด๋ฅผ ๋ก๊ทธ ํํ๋ก ๋ํ๋ด๋ฉด:
PP(W)=eโ1NlogโกP(W)PP(W) = e^{-\frac{1}{N} \log P(W)}PP(W)=eโN1โlogP(W)
3. Perplexity์ ๊ณ์ฐ ๊ณผ์
-
๋ฌธ์ฅ WWW์ ํ๋ฅ ๊ณ์ฐ:
๋ฌธ์ฅ WWW๋ ๊ฐ ๋จ์ด์ ์กฐ๊ฑด๋ถ ํ๋ฅ ๋ก ๊ณ์ฐ๋ฉ๋๋ค:
P(W)=P(w1)โ P(w2โฃw1)โ P(w3โฃw1,w2)โฏP(wNโฃw1,w2,โฆ,wNโ1)P(W) = P(w_1) \cdot P(w_2 w_1) \cdot P(w_3 w_1, w_2) \cdots P(w_N w_1, w_2, \dots, w_{N-1})P(W)=P(w1โ)โ P(w2โโฃw1โ)โ P(w3โโฃw1โ,w2โ)โฏP(wNโโฃw1โ,w2โ,โฆ,wNโ1โ) ์ด ๊ณ์ฐ์ ์ธ์ด ๋ชจ๋ธ์ด ๋จ์ด๋ฅผ ๋ฌธ๋งฅ์ ๊ธฐ๋ฐํด ์ผ๋ง๋ ์ ์์ธกํ๋์ง๋ฅผ ๋ํ๋ ๋๋ค.
-
๋ก๊ทธ ๋ณํ:
๊ณฑ์ ํํ์ ํ๋ฅ P(W)P(W)P(W)๋ฅผ ๋ก๊ทธ๋ฅผ ํตํด ํฉ์ฐ ํํ๋ก ๋ณํํฉ๋๋ค:
logโกP(W)=logโกP(w1)+logโกP(w2โฃw1)+โฏ+logโกP(wNโฃw1,w2,โฆ,wNโ1)\log P(W) = \log P(w_1) + \log P(w_2 w_1) + \dots + \log P(w_N w_1, w_2, \dots, w_{N-1})logP(W)=logP(w1โ)+logP(w2โโฃw1โ)+โฏ+logP(wNโโฃw1โ,w2โ,โฆ,wNโ1โ) ์ด๋ฅผ ๋จ์ด ๊ฐ์ NNN์ผ๋ก ์ ๊ทํํ๋ฉด:
โ1NlogโกP(W)=โ1Nโi=1NlogโกP(wi)-\frac{1}{N} \log P(W) = -\frac{1}{N} \sum_{i=1}^N \log P(w_i)โN1โlogP(W)=โN1โi=1โNโlogP(wiโ)
-
Perplexity ๊ณ์ฐ:
๋ก๊ทธ๋ฅผ ์ง์ ํจ์๋ก ๋ณํํ์ฌ ์ต์ข ์ ์ผ๋ก Perplexity๋ฅผ ๊ณ์ฐํฉ๋๋ค:
PP(W)=eโ1Nโi=1NlogโกP(wi)PP(W) = e^{-\frac{1}{N} \sum_{i=1}^N \log P(w_i)}PP(W)=eโN1โโi=1NโlogP(wiโ)
์ด ๊ณ์ฐ ๊ฒฐ๊ณผ๋ ์ธ์ด ๋ชจ๋ธ์ด ๋จ์ด๋ฅผ ์ผ๋ง๋ ํจ์จ์ ์ผ๋ก ์์ธกํ๋์ง ๋ํ๋ ๋๋ค.
4. Perplexity์ ์ง๊ด์ ํด์
- Perplexity๋ ๋ชจ๋ธ์ด ๋จ์ด ์ํ์ค๋ฅผ ์์ธกํ๋ ํ๊ท ์ ์ธ ๋ณต์ก๋๋ฅผ ๋ํ๋ ๋๋ค.
- ๋ฎ์ Perplexity ๊ฐ: ๋ชจ๋ธ์ด ์ฃผ์ด์ง ๋ฌธ์ฅ์ ์ ์์ธก โ ์ ํ์ง๊ฐ ์ ์.
- ๋์ Perplexity ๊ฐ: ๋ชจ๋ธ์ด ์ฃผ์ด์ง ๋ฌธ์ฅ์ ์ ์์ธกํ์ง ๋ชปํจ โ ์ ํ์ง๊ฐ ๋ง์.
- Perplexity ๊ฐ์ด ์์์๋ก ๋ชจ๋ธ์ ์์ธก์ด ๋ ์ ํํ๋ฉฐ, ์ธ์ด ๋ชจ๋ธ์ด ๋ ์ ํฉํ๋ค๋ ๊ฒ์ ์๋ฏธํฉ๋๋ค.
5. Perplexity์์ ์ง์ (-\frac{1}{N})์ ์ฌ์ฉํ๋ ์ด์
-
์ ๊ทํ๋ฅผ ํตํด ํ๊ท ํ:
- ๋ฌธ์ฅ์ ํ๋ฅ P(W)P(W)P(W)๋ ๋ฌธ์ฅ์ด ๊ธธ์ด์ง์๋ก ๋งค์ฐ ์์์ง๋ ๊ฐ์ด๋ฏ๋ก, ๋จ์ด ๊ฐ์ NNN์ผ๋ก ๋๋ ํ๊ท ๋จ์ด ํ๋ฅ ์ ์ ๊ทํํฉ๋๋ค.
- ์ด๋ฅผ ํตํด Perplexity๋ ๋ฌธ์ฅ ๊ธธ์ด์ ์ํฅ์ ๋ฐ์ง ์๊ณ , ๋ชจ๋ธ ์ฑ๋ฅ์ ๊ณต์ ํ๊ฒ ํ๊ฐํ ์ ์์ต๋๋ค.
-
์ญ์ ํํ๋ก ๋ชจ๋ธ์ ํผ๋๋๋ฅผ ํํ:
- ํ๋ฅ P(W)P(W)P(W)๊ฐ ๋์ผ๋ฉด Perplexity๋ ์์์ง๊ณ , ํ๋ฅ P(W)P(W)P(W)๊ฐ ๋ฎ์ผ๋ฉด Perplexity๋ ์ปค์ง๋๋ค.
- ์ด๋ Perplexity๊ฐ โ๋ชจ๋ธ์ ์์ธก ์ฑ๋ฅโ์ ์ง๊ด์ ์ผ๋ก ํด์ํ ์ ์๊ฒ ๋ง๋ญ๋๋ค.
-
์ ๋ณด ์ด๋ก ์ ๊ทผ๊ฑฐ:
- Perplexity๋ ์ ๋ณด ์ด๋ก ์์ ์ฌ์ฉ๋๋ ์ํธ๋กํผ HHH์ ๋ฐ์ ํ๊ฒ ๊ด๋ จ๋์ด ์์ต๋๋ค:H=โ1Nโi=1NlogโกP(wi)H = -\frac{1}{N} \sum_{i=1}^N \log P(w_i)H=โN1โi=1โNโlogP(wiโ)Perplexity๋ ์ด๋ฅผ ์ง์ ํจ์๋ก ๋ณํํ ๊ฐ:PP=eHPP = e^HPP=eH
6. Perplexity์ ํ์ฉ
- Perplexity๋ ์ธ์ด ๋ชจ๋ธ์ ์ฑ๋ฅ์ ์ธก์ ํ๋ ๋ฐ ์ฌ์ฉ๋ฉ๋๋ค.
- ๋ชจ๋ธ์ด ํน์ ๋ฌธ๋งฅ์์ ๋จ์ด๋ฅผ ์ผ๋ง๋ ์ ํํ ์์ธกํ๋์ง ํ๊ฐํ์ฌ, ํ์ต๋ ๋ชจ๋ธ์ ํ์ง์ ๋ํ๋ ๋๋ค.
- ์๋ฅผ ๋ค์ด, ๋ฒ์ญ ๋ชจ๋ธ, ์์ฑ ์ธ์ ๋ชจ๋ธ ๋ฑ์์ ๋ชจ๋ธ ์ฑ๋ฅ์ ์ ๋์ ์ผ๋ก ๋น๊ตํ๋ ๋ฐ ์ ์ฉํฉ๋๋ค.
BLEU (Bilingual Evaluation Understudy) Score
1. BLEU ์ค์ฝ์ด๋ ๋ฌด์์ธ๊ฐ?
- BLEU(Bilingual Evaluation Understudy) ์ค์ฝ์ด๋ ๊ธฐ๊ณ ๋ฒ์ญ์์ ์์ฑ๋ ๋ฒ์ญ๋ฌธ๊ณผ ์ฐธ์กฐ ๋ฒ์ญ๋ฌธ(reference translation) ๊ฐ์ ์ ์ฌ๋๋ฅผ ์ธก์ ํ๋ ์๋ ํ๊ฐ ์งํ์ ๋๋ค.
- ๋ฒ์ญ๋ ๋ฌธ์ฅ์ ์ ํ์ฑ(accuracy)์ ํ๊ฐํ๋ฉฐ, ์ธ๊ฐ ๋ฒ์ญ๊ณผ ์ผ๋ง๋ ์ ์ฌํ์ง๋ฅผ ์์นํํฉ๋๋ค.
- BLEU ์ค์ฝ์ด๋ 0์์ 1 ์ฌ์ด์ ๊ฐ์ผ๋ก ๊ณ์ฐ๋๋ฉฐ, ์ผ๋ฐ์ ์ผ๋ก ํผ์ผํธ(0~100) ํํ๋ก ํํ๋ฉ๋๋ค:
- BLEU ์ค์ฝ์ด = 1 (100%) โ ์์ฑ๋ ๋ฒ์ญ์ด ์ฐธ์กฐ ๋ฒ์ญ๊ณผ ์๋ฒฝํ ์ผ์น.
- BLEU ์ค์ฝ์ด = 0 โ ์์ฑ๋ ๋ฒ์ญ์ด ์ฐธ์กฐ ๋ฒ์ญ๊ณผ ์์ ํ ๋ค๋ฆ.
2. BLEU ์ค์ฝ์ด์ ์ ์
BLEU๋ ๋ค์๊ณผ ๊ฐ์ ์ฃผ์ ์์๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์ ์๋ฉ๋๋ค:
BLEU=BPโ expโก(โn=1Nwnโ logโกPn)BLEU = BP \cdot \exp \left( \sum_{n=1}^{N} w_n \cdot \log P_n \right)BLEU=BPโ exp(n=1โNโwnโโ logPnโ)
๊ตฌ์ฑ ์์:
- NNN-๊ทธ๋จ Precision (PnP_nPnโ): ์์ฑ๋ ๋ฒ์ญ๋ฌธ๊ณผ ์ฐธ์กฐ ๋ฒ์ญ๋ฌธ ๊ฐ์ nnn-๊ทธ๋จ(n-gram) ์ ์ฌ๋๋ฅผ ๊ณ์ฐ.
- ๊ฐ์ค์น (wnw_nwnโ): ๊ฐ nnn-๊ทธ๋จ์ ๋ํ ์ค์๋๋ฅผ ์ค์ (์ผ๋ฐ์ ์ผ๋ก ๋์ผํ ๊ฐ์ค์น).
- Brevity Penalty (BP): ๋ฒ์ญ๋ฌธ์ ๊ธธ์ด๊ฐ ์ฐธ์กฐ ๋ฒ์ญ๋ฌธ๊ณผ ๋น๊ตํด ๋๋ฌด ์งง์ ๋ ํจ๋ํฐ๋ฅผ ๋ถ๊ณผ.
3. BLEU ๊ณ์ฐ ๊ณผ์
-
nnn-๊ทธ๋จ ์ ์ฌ๋ ๊ณ์ฐ:
- nnn-๊ทธ๋จ์ ๋ฒ์ญ๋ฌธ์์ nnn๊ฐ์ ์ฐ์๋ ๋จ์ด๋ฅผ ๋งํฉ๋๋ค.
- BLEU๋ 111-๊ทธ๋จ๋ถํฐ 444-๊ทธ๋จ๊น์ง ๊ณ์ฐํ๋ ๊ฒ์ด ์ผ๋ฐ์ ์ ๋๋ค.
- ์์ฑ๋ ๋ฒ์ญ๋ฌธ์์ ์ฐธ์กฐ ๋ฒ์ญ๋ฌธ์ ์ผ์นํ๋ nnn-๊ทธ๋จ์ ๋น์จ์ ๊ณ์ฐ:Pn=์์ฑ๋ย ๋ฒ์ญ๋ฌธ์์ย ์ฐธ์กฐย ๋ฒ์ญ๋ฌธ๊ณผย ์ผ์นํ๋ย n-๊ทธ๋จย ๊ฐ์์์ฑ๋ย ๋ฒ์ญ๋ฌธ์ย n-๊ทธ๋จย ๊ฐ์P_n = \frac{\text{์์ฑ๋ ๋ฒ์ญ๋ฌธ์์ ์ฐธ์กฐ ๋ฒ์ญ๋ฌธ๊ณผ ์ผ์นํ๋ $n$-๊ทธ๋จ ๊ฐ์}}{\text{์์ฑ๋ ๋ฒ์ญ๋ฌธ์ $n$-๊ทธ๋จ ๊ฐ์}}Pnโ=์์ฑ๋ย ๋ฒ์ญ๋ฌธ์ย n-๊ทธ๋จย ๊ฐ์์์ฑ๋ย ๋ฒ์ญ๋ฌธ์์ย ์ฐธ์กฐย ๋ฒ์ญ๋ฌธ๊ณผย ์ผ์นํ๋ย n-๊ทธ๋จย ๊ฐ์โ
-
๊ธธ์ด ํจ๋ํฐ (Brevity Penalty, BP):
BP={1ifย c>re1โrcifย cโคrBP = \begin{cases} 1 & \text{if } c > r \ e^{1 - \frac{r}{c}} & \text{if } c \leq r \end{cases}BP={1e1โcrโโifย c>rifย cโคrโ
์ฌ๊ธฐ์:
- ccc: ์์ฑ๋ ๋ฒ์ญ๋ฌธ์ ๊ธธ์ด.
- rrr: ์ฐธ์กฐ ๋ฒ์ญ๋ฌธ์ ๊ธธ์ด.
-
BLEU ๊ณ์ฐ:
BLEU=BPโ expโก(1Nโn=1NlogโกPn)BLEU = BP \cdot \exp \left( \frac{1}{N} \sum_{n=1}^N \log P_n \right)BLEU=BPโ exp(N1โn=1โNโlogPnโ)
BLEU๋ ์ฌ๋ฌ nnn-๊ทธ๋จ์ ์ ์ฌ๋๋ฅผ ์ข ํฉํ์ฌ ์ต์ข ์ ์๋ฅผ ๊ณ์ฐํฉ๋๋ค.
4. BLEU ์ค์ฝ์ด์ ์ง๊ด์ ํด์
- BLEU๋ ์์ฑ๋ ๋ฒ์ญ์ด ์ฐธ์กฐ ๋ฒ์ญ๊ณผ ์ผ๋ง๋ ์ ์ฌํ์ง๋ฅผ ์์นํํฉ๋๋ค.
- PnP_nPnโ: ๊ฐ nnn-๊ทธ๋จ์ ๋ํด ์ผ๋ง๋ ์ผ์นํ๋์ง๋ฅผ ์ธก์ .
- BLEU๋ nnn-๊ทธ๋จ Precision ๊ฐ์ ์ข ํฉํ์ฌ, ๋ฒ์ญ๋ฌธ์ ์ ํ์ฑ๋ฟ๋ง ์๋๋ผ ์ ์ฐฝ์ฑ์ ํจ๊ป ํ๊ฐํฉ๋๋ค.
5. BLEU ์ค์ฝ์ด์ ํ๊ณ
-
๋ฌธ๋งฅ ๋ฐ ์๋ฏธ ๋ฌด์:
- BLEU๋ ๋จ์ํ nnn-๊ทธ๋จ ์ ์ฌ๋๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํ๋ฏ๋ก, ๋ฌธ์ฅ์ ์๋ฏธ๋ ๋ฌธ๋งฅ์ ์ ์ฐฝ์ฑ์ ํ๊ฐํ์ง ๋ชปํฉ๋๋ค.
-
๋ค์ํ ํํ์ ํ๊ฐ ๋ถ์กฑ:
- BLEU๋ ๋จ์ผ ์ฐธ์กฐ ๋ฒ์ญ๋ฌธ๊ณผ์ ๋น๊ต๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํ๋ฏ๋ก, ๋์ผํ ์๋ฏธ๋ฅผ ๊ฐ์ง๋ ๋ค์ํ ํํ์ ์ ๋๋ก ํ๊ฐํ์ง ๋ชปํฉ๋๋ค.
-
์งง์ ๋ฌธ์ฅ์์ ๋ถ์ ํ:
- ๊ธธ์ด ํจ๋ํฐ๊ฐ ์ ์ฉ๋๋๋ผ๋ ์งง์ ๋ฌธ์ฅ์์ BLEU์ ํ๊ฐ๊ฐ ์๊ณก๋ ๊ฐ๋ฅ์ฑ์ด ์์ต๋๋ค.
6. BLEU์ ํ์ฉ
- BLEU๋ ๊ธฐ๊ณ ๋ฒ์ญ ๋ชจ๋ธ์ ์ฑ๋ฅ์ ๋น๊ตํ๋ ๋ฐ ๋๋ฆฌ ์ฌ์ฉ๋ฉ๋๋ค.
- ๋ฒ์ญ ํ์ง ์๋ ํ๊ฐ:
- ์ธ๊ฐ ํ๊ฐ๋ณด๋ค ํจ์ฌ ๋น ๋ฅด๊ณ ํจ์จ์ ์ผ๋ก ๋ฒ์ญ ํ์ง์ ์ ๋ํ.
- ๋ชจ๋ธ ์ฑ๋ฅ ๊ฐ์ :
- BLEU ์ ์๋ฅผ ๊ธฐ์ค์ผ๋ก ๋ชจ๋ธ์ ์ต์ ํํ๋ ๋ฐ ํ์ฉ.
7. BLEU์ Perplexity์ ๋น๊ต
- BLEU๋ ๋ฒ์ญ ํ์ง์ ํ๊ฐํ๋ ๋ฐ ์ค์ ์ ๋๋ฉฐ, Perplexity๋ ์ธ์ด ๋ชจ๋ธ์ ์ผ๋ฐ์ ์ธ ์์ธก ์ฑ๋ฅ์ ์ธก์ ํฉ๋๋ค.
- ๋ ์งํ๋ ์ํธ ๋ณด์์ ์ผ๋ก ์ฌ์ฉ๋๋ฉฐ, ๊ฐ๊ฐ ๋ค๋ฅธ ์ธก๋ฉด์์ ๋ชจ๋ธ ์ฑ๋ฅ์ ํ๊ฐํฉ๋๋ค.
์์ฝ
- Perplexity์ BLEU๋ ๋ชจ๋ ์ธ์ด ๋ชจ๋ธ์ ์ฑ๋ฅ์ ํ๊ฐํ๋ ์ค์ํ ์งํ์
๋๋ค.
- Perplexity๋ ๋ชจ๋ธ์ด ๋จ์ด๋ฅผ ์ผ๋ง๋ ์ ์์ธกํ๋์ง๋ฅผ ์ธก์ ํ๋ฉฐ, ๋ฎ์์๋ก ์ฑ๋ฅ์ด ์ฐ์ํฉ๋๋ค.
- BLEU๋ ๋ฒ์ญ๋ฌธ๊ณผ ์ฐธ์กฐ ๋ฒ์ญ๋ฌธ์ ์ ์ฌ๋๋ฅผ ์ธก์ ํ๋ฉฐ, ์ ์๊ฐ ๋์์๋ก ๋ฒ์ญ ํ์ง์ด ๋ฐ์ด๋ฉ๋๋ค.
- ๋ ์งํ ๋ชจ๋ ๊ฐ๊ธฐ ๋ค๋ฅธ ๊ด์ ์์ ๋ชจ๋ธ ์ฑ๋ฅ์ ํ๊ฐํ๋ฉฐ, ๋ณด์์ ์ผ๋ก ์ฌ์ฉ๋ฉ๋๋ค.
- Perplexity๋ ๋ชจ๋ธ์ ํ์ต ํ์ง ํ๊ฐ์, BLEU๋ ๋ฒ์ญ ๋ชจ๋ธ์ ๊ฒฐ๊ณผ๋ฌผ ํ๊ฐ์ ์ ํฉํฉ๋๋ค.