[OpenAI] ์ธ์ด๋ชจ๋ธ ํ๊ฐ(Hallucination) ํ์: ์ AI๋ ํ์ ์ ์ฐฌ ๊ฑฐ์ง๋ง์ ํ ๊น?
์๋ณธ ๊ฒ์๊ธ: https://velog.io/@euisuk-chung/OpenAI-์ธ์ด๋ชจ๋ธ-ํ๊ฐHallucination-ํ์-์-AI๋-ํ์ ์-์ฐฌ-๊ฑฐ์ง๋ง์-ํ ๊น
Source:
ํด๋น ๋ธ๋ก๊ทธ ํฌ์คํธ๋ ์ source๋ค์ ์ฐธ๊ณ ํ์ฌ ์์ฑํ์ต๋๋ค.
TL;DR
-
ํด๊ฒฐํ๊ณ ์ ํ๋ ๋ฌธ์ ์ ์ค์์ฑ:
- ๋ํ ์ธ์ด ๋ชจ๋ธ์ ํ๊ฐ(hallucination) ํ์์ ์ ๋ขฐ์ฑ์ ํฌ๊ฒ ์ ํดํ๋ ํต์ฌ ๋ฌธ์
- ๊ธฐ์กด ์ต์ฒจ๋จ ๋ชจ๋ธ๋ค์์๋ ์ง์์ ์ผ๋ก ๋ฐ์ํ๋ ๊ทผ๋ณธ์ ํ๊ณ
-
๊ธฐ์กด ์ ๊ทผ๋ฒ์ ํ๊ณ:
- ํ๊ฐ์ ์ ๋น๋ก์ด ํ์์ผ๋ก ๋ค๋ฃจ์ด ๊ทผ๋ณธ ์์ธ์ ๋ํ ์ฒด๊ณ์ ๋ถ์ ๋ถ์กฑ
- ํํ๋ จ ๊ธฐ๋ฒ๋ค์ด ํ๊ฐ์ ์์ ํ ์ ๊ฑฐํ์ง ๋ชปํ๋ ์ด์ ์ ๋ํ ๋ช ํํ ์ค๋ช ๋ถ์ฌ
-
์ ์ํ๋ ํด๊ฒฐ์ฑ ์ ๋ ์ฐฝ์ฑ:
- Is-It-Valid (IIV) ์ด์ง ๋ถ๋ฅ ๋ฌธ์ ๋ก์ ํ์: ์์ฑ ์ค๋ฅ๋ฅผ ์ด์ง ๋ถ๋ฅ ์ค๋ฅ์ ์ฐ๊ฒฐํ๋ ์๋ก์ด ์ด๋ก ์ ํ๋ ์์ํฌ
- ์ฌํ๊ธฐ์ ์ ๊ด์ : ํ๊ฐ ๋ฐฉ์ ์์ฒด๊ฐ ํ๊ฐ์ ๊ฐํํ๋ค๋ ํต์ฐฐ
- ๋ช ์์ ์ ๋ขฐ๋ ๋ชฉํ: ๊ธฐ์กด ๋ฒค์น๋งํฌ ์์ ์ ํตํ ์ค์ฉ์ ํด๊ฒฐ์ฑ ์ ์
-
์์๋๋ ํ๊ธํจ๊ณผ:
- ์ธ์ด ๋ชจ๋ธ ํ๋ จ๊ณผ ํ๊ฐ ํจ๋ฌ๋ค์์ ๊ทผ๋ณธ์ ๋ณํ ์ ๋
- ๋ ์ ๋ขฐํ ์ ์๋ AI ์์คํ ๊ฐ๋ฐ์ ์ํ ์ด๋ก ์ ๊ธฐ๋ฐ ์ ๊ณต
๐ Chapter 1: Introduction - ํ๊ฐ ํ์์ ๋ณธ์ง๊ณผ ์ฐ๊ตฌ ๋๊ธฐ
์ฑํฐ์ ํต์ฌ ๊ธฐ์ฌ
- ํ๊ฐ์ ์ ๋น๋ก์ด ํ์์์ ํต๊ณ์ ์ผ๋ก ์ดํด ๊ฐ๋ฅํ ํ์์ผ๋ก ์ฌ์ ์
- ์ฌ์ ํ๋ จ๊ณผ ํํ๋ จ์ ์ญํ ์ ๋ช ํํ ๊ตฌ๋ถํ์ฌ ๋ถ์ ํ๋ ์์ํฌ ์ ์
- IIV ํ์์ด๋ผ๋ ์๋ก์ด ์ด๋ก ์ ๋๊ตฌ ๋์
- ํ๊ฐ ๋ฐฉ์ ์์ฒด๊ฐ ๋ฌธ์ ๋ผ๋ ์ฌํ๊ธฐ์ ์ ํต์ฐฐ ์ ์
์๋ก ์ ํ๊ฐ ํ์์ ์๋ก์ด ๊ด์ ์์ ๋ฐ๋ผ๋ณด๋ ์ด๋ก ์ ํ์ ์ ์ํ๋ฉฐ, ๊ธฐ์กด์ ์ ๋น๋ก์ด ํ์์ผ๋ก ์ฌ๊ฒจ์ก๋ ํ๊ฐ์ ํต๊ณ์ ์ผ๋ก ๋ถ์ ๊ฐ๋ฅํ ๋ฌธ์ ๋ก ์ฌ์ ์ํฉ๋๋ค. ์ ์ฒด ๋ ผ๋ฌธ์ ํต์ฌ ์์ด๋์ด์ธ Is-It-Valid(IIV) ํ์๊ณผ ์ฌํ๊ธฐ์ ์ ํด๊ฒฐ์ฑ ์ ๋๊ธฐ๋ฅผ ๋ช ํํ ์ ์ํ๋ ์ค์ํ ๋์ ๋ถ ์ญํ ์ ํฉ๋๋ค.
1. ํ๊ฐ ํ์์ ๊ตฌ์ฒด์ ์ ์์ ์ค์ฆ์ ์ฆ๊ฑฐ
ํ์-์ํ ์ ์ถ์ ์ฌ์ธต ๋ถ์:
- ์ ์๋ค์ ์ฐ๋ฆฌ๊ฐ ์ง๋ฉดํ๊ณ ์๋ ์ธ์ด ๋ชจ๋ธ์ ํ๊ฐ์ โ์ด๋ ค์ด ์ํ ๋ฌธ์ ์ ์ง๋ฉดํ ํ์์ด ๋ถํ์คํ ๋ ์ถ์ธกํ๋ ํ๋โ์ ๋น์ ํฉ๋๋ค.
- ์ด ์ ์ถ๋ ๋จ์ํ ์์ ๊ฐ ์๋๋ผ ํ๋ฐ๋ถ์์ ์ ์๋๋ ์ฌํ๊ธฐ์ ์ ๋ถ์์ ํต์ฌ ํ ๋๊ฐ ๋ฉ๋๋ค
- ์ถ์ธก์ด ์ต์ ์ ๋ต์ด ๋๋ ์กฐ๊ฑด:
- ์ ๋ต ์ 1์ , ์ค๋ต์ด๋ ๊ณต๋ฐฑ ์ 0์ ์ธ ์ด์ง ์ฑ์ ์์คํ (aka, ์ฐ์ด์ ๋ง์ถ๋ฉด ์ด๋์ธ ์์คํ )
๊ตฌ์ฒด์ ํ๊ฐ ์ฌ๋ก์ ์์ธ ๋ถ์:
-
Adam Kalai์ ์์ผ ์ง๋ฌธ:
- DeepSeek-V3 ๋ชจ๋ธ์ด โ์๊ณ ์๋ค๋ฉด DD-MM ํ์์ผ๋ก๋ง ๋ตํ๋ผโ๋ ๋ช ํํ ์กฐ๊ฑด๋ถ ์ง์์๋ ๋ถ๊ตฌํ๊ณ ์ธ ๋ฒ์ ์๋์์ ๊ฐ๊ฐ ๋ค๋ฅธ ์๋ชป๋ ๋ ์ง๋ฅผ ์ ๊ณต
-
์ค์ ์ ๋ต:
- ๊ฐ์(Autumn) - ์ด๋ ๋ชจ๋ธ์ด ๊ณ์ ์ ๋ณด์กฐ์ฐจ ํ์ฉํ์ง ๋ชปํ์์ ์์ฌ
-
Table 1์ ํ์๋ ผ๋ฌธ ์ ๋ชฉ ํ๊ฐ: ์ธ ๊ฐ์ ์ธ๊ธฐ ์ธ์ด ๋ชจ๋ธ ๋ชจ๋ ์์ ํ ๋ค๋ฅธ ์ ๋ชฉ๊ณผ ์ฐ๋๋ฅผ ์์ฑ
- ChatGPT(GPT-4o): โBoosting, Online Algorithms, and Other Topics in Machine Learningโ (CMU, 2002)
- DeepSeek: โAlgebraic Methods in Interactive Machine Learningโ (Harvard, 2005)
- Llama: โEfficient Algorithms for Learning and Playing Gamesโ (MIT, 2007)
- ์ค์ : Kalai (2001)
ํ๊ฐ์ ์ ํ๋ก ์ ๋ถ๋ฅ:
- ๋ด์ฌ์ ํ๊ฐ(Intrinsic hallucinations): ์ฌ์ฉ์ ํ๋กฌํํธ์ ๋ชจ์๋๋ ๋ด์ฉ
- ์ธ์ฌ์ ํ๊ฐ(Extrinsic hallucinations): ํ๋ จ ๋ฐ์ดํฐ๋ ์ธ๋ถ ํ์ค๊ณผ ๋ชจ์๋๋ ๋ด์ฉ
์์ Counting Problem :
- โDEEPSEEK์ D๊ฐ ๋ช ๊ฐ ์๋๊ฐ?โ๋ผ๋ ๋จ์ํ ์ง๋ฌธ์์๋ โ2โ, โ3โ, โ6โ, โ7โ ๋ฑ ๋ค์ํ ์ค๋ต ์์ฑ
2. ๊ณ์ฐ ํ์ต ์ด๋ก ์ ์ ๊ทผ๋ฒ์ ๋์
ํ์์ ์ ์์ ์ค์์ฑ:
ํ๊ฐ์ ๊ฐ์ฑ์ ์ด๊ฑฐ๋ ์ง๊ด์ ์ฉ์ด๊ฐ ์๋ ์ํ์ ์ผ๋ก ์ ํํ ๊ฐ๋ ์ผ๋ก ์ ์
- ์ ์ฒด ์งํฉ X: ๋ชจ๋ ๊ทธ๋ด๋ฏํ ๋ฌธ์์ด์ ์งํฉ
- ์ค๋ฅ ์งํฉ E: ๊ทธ๋ด๋ฏํ์ง๋ง ์๋ชป๋ ๋ฌธ์์ด๋ค
- ์ ํจ ์งํฉ V: ์ฌ๋ฐ๋ฅธ ๋ฌธ์์ด๋ค
- ๋ถํ ์กฐ๊ฑด: X=EโชVX = E โช VX=EโชV (์๋ก์ ์งํฉ)
๊ณ์ฐ ํ์ต ์ด๋ก ์ฐ๊ฒฐ์ ์์:
- ์์ญ ๋ ๊ฐ ์ถ์ ๋ ๋ถ๋ฅ ์ค๋ฅ์ ๋ํ ์ด๋ก ์ ์ง์์ ํ๊ฐ ๋ถ์์ ํ์ฉ
- ํ๊ฐ์ ๋จ์ํ โ๊ณ ์ณ์ผ ํ ๋ฌธ์ โ๊ฐ ์๋ โ์ดํดํ ์ ์๋ ํ์โ์ผ๋ก ์ ํ
- Kearns and Vazirani (1994)์ ์ ํต์ ๊ณ์ฐ ํ์ต ์ด๋ก ๊ณผ์ ๋ช ํํ ์ฐ๊ฒฐ ์ค์
3. Section 1.1: ์ฌ์ ํ๋ จ์ผ๋ก ์ธํ ์ค๋ฅ - ํต๊ณ์ ํ์ฐ์ฑ
๊ธฐ์กด ํต๋ ๊ณผ ๊ทธ ํ๊ณ
์ผ๋ฐ์ ์ธ ํ๊ฐ ์์ธ ์ถ์ :
๋๋ถ๋ถ์ ์ฐ๊ตฌ์๋ค๊ณผ ๊ฐ๋ฐ์๋ค์ ํ๊ฐ์ด ๋ค์๊ณผ ๊ฐ์ ์ด์ ๋ก ๋ฐ์ํ๋ค๊ณ ์๊ฐํด์์ต๋๋ค:
- ๋ถ์์ ํ ํ๋ จ ๋ฐ์ดํฐ: ์ธํฐ๋ท์์ ์์งํ ๋ฐ์ดํฐ์ ์๋ชป๋ ์ ๋ณด๊ฐ ํฌํจ
- ๋ถ์กฑํ ํ๋ จ๋: ๋ ๋ง์ ๋ฐ์ดํฐ์ ๋ ๊ธด ํ๋ จ์ผ๋ก ํด๊ฒฐ ๊ฐ๋ฅ
- ๋ชจ๋ธ ํฌ๊ธฐ ํ๊ณ: ๋ ํฐ ๋ชจ๋ธ์ด๋ฉด ํ๊ฐ์ด ์ค์ด๋ค ๊ฒ
์ด๋ฌํ ์ ๊ทผ๋ฒ์ ๊ทผ๋ณธ์ ํ๊ณ:
- ํ์ง๋ง ์ ์๋ค์ ์ด๋ฐ โ๋ฐ์ดํฐ ํ์ง ๊ฐ์ โ ์ ๊ทผ๋ฒ๋ง์ผ๋ก๋ ํ๊ฐ์ ์์ ํ ํด๊ฒฐํ ์ ์๋ค๊ณ ์ฃผ์ฅํฉ๋๋ค.
- ์๋ํ๋ฉด ์๋ฒฝํ ๋ฐ์ดํฐ๋ฅผ ์ฌ์ฉํด๋ ํ๊ฐ์ด ๋ฐ์ํ๊ธฐ ๋๋ฌธ์ ๋๋ค.
๋ฐ์ง๊ด์ ํต์ฌ ์ฃผ์ฅ
์ถฉ๊ฒฉ์ ์ธ ๋ฐ๊ฒฌ:
- ์ค๋ฅ ์๋ ํ๋ จ ๋ฐ์ดํฐ์์๋ ํต๊ณ์ ๋ชฉ์ ํจ์ ์ต์ ํ๊ฐ ์ค๋ฅ ์์ฑ์ผ๋ก ์ด์ด์ง
- ์ด๋ ํ๋ จ ๋ฐ์ดํฐ์ ์ง๊ณผ ๋ฌด๊ดํ๊ฒ ๋ฐ์ํ๋ ๊ตฌ์กฐ์ ๋ฌธ์ ์์ ์๋ฏธ
์ ์ด๊ฒ์ด ์ค์ํ๊ฐ:
- ๊ธฐ์กด์๋ โ๋ ๊นจ๋ํ ๋ฐ์ดํฐโ๋ฅผ ์์งํ๋ฉด ํด๊ฒฐ๋ ๋ฌธ์ ๋ก ์ฌ๊ฒจ์ก์ต๋๋ค.
- ํ์ง๋ง ์ ์๋ค์ ๋ถ์์ ๋ฐ๋ฅด๋ฉด, ์ค๋ น ๋ชจ๋ ํ๋ จ ๋ฐ์ดํฐ๊ฐ 100% ์ ํํด๋ ์ฌ์ ํ ํ๊ฐ์ด ๋ฐ์ํ ์๋ฐ์ ์์ต๋๋ค.
์ฆ, ํ์ต ๋ฐฉ๋ฒ์ด ์๋ชป๋์๋ค๋ ๋ง!!
์ค๋ฅ๋ฅผ ํผํ๋ ํดํ๋ ๋ชจ๋ธ๋ค์ ๋ถ์
ํ๊ฐ ์๋ ๋ชจ๋ธ๋ค์ด ์ ์ค์ฉ์ ์ด์ง ์์๊ฐ:
ํ๊ฐ์ด ์๋ ๋ชจ๋ธ์ ํฌ๊ฒ 3๊ฐ์ง๊ฐ ์์ต๋๋ค:
- โI donโt knowโ (IDK) ๋ชจ๋ธ
- โํญ์ IDKโ ๋ชจ๋ธ:
1
2
3
4
5
์ฌ์ฉ์: "ํ๋ฆฌ์ ์๋๋ ์ด๋์ธ๊ฐ์?"
๋ชจ๋ธ: "๋ชจ๋ฅด๊ฒ ์ต๋๋ค"
์ฌ์ฉ์: "2+2๋?"
๋ชจ๋ธ: "๋ชจ๋ฅด๊ฒ ์ต๋๋ค"
- ์ค๋ฅ๋ ํผํ์ง๋ง ๋ฐ๋ ์ถ์ ์ด๋ผ๋ ์ธ์ด ๋ชจ๋ธ๋ง์ ๊ธฐ๋ณธ ๋ชฉํ์ ์คํจ
- ์ค์ฉ์ฑ์ด ์ ๋ฌดํ์ฌ ์ธ์ด ๋ชจ๋ธ๋ก์ ์๋ฏธ ์์
- โ๋จ์ ์๊ธฐโ ๋ชจ๋ธ:
1
2
์ฌ์ฉ์: "์ค๋ ๋ ์จ๋ ์ด๋์?"
๋ชจ๋ธ: "Einstein was born in 1879" (ํ๋ จ ๋ฐ์ดํฐ์์ ๋ฌด์์ ์ ํ)
- ํ๋ จ ์์ ๋ฅผ ๋ฌด์์๋ก ๋ฐ๋ณต ์ถ๋ ฅ
- ์ค๋ฅ ์๋ ํ๋ จ ๋ฐ์ดํฐ ๊ฐ์ ํ์์๋ ์ค๋ฅ ์์ฑ ์ํจ
- ํ์ง๋ง ์๋ก์ด ์ ๋ ฅ์ ๋ํ ์ผ๋ฐํ ๋ฅ๋ ฅ ์ ๋ฌด
- โ์ต์ ๋ชจ๋ธโ pฬ = p:
- ํ๋ จ ๋ถํฌ์ ์์ ํ ์ผ์นํ๋ ์ด๋ก ์ ์ต์ ๋ชจ๋ธ
- ํ์ค์ ์ผ๋ก ๋ฌ์ฑ ๋ถ๊ฐ๋ฅํ ๋ฌดํํ ํ๋ จ ๋ฐ์ดํฐ ์๊ตฌ
- ๊ณ์ฐ์ ์ผ๋ก๋ ์คํ ๋ถ๊ฐ๋ฅ
ํต์ฌ ํต์ฐฐ: ์ค์ฉ์ ์ธ ์ธ์ด ๋ชจ๋ธ์ด๋ฉด์ ๋์์ ํ๊ฐ์ ์์ ํ ํผํ๋ ๋ชจ๋ธ์ ์กด์ฌํ ์ ์์ต๋๋ค.
IIV(Is-It-Valid) ํต์ฌ ํต์ฐฐ
๊ธฐ์กด ์ ๊ทผ๋ฒ์ ๋ฌธ์ ์ :
ํ๊ฐ์ ์ ๋น๋ก์ด ํ์์ผ๋ก ๋ค๋ฃจ์ด ๊ทผ๋ณธ ์์ธ์ ํ์
ํ๊ธฐ ์ด๋ ค์ ์ต๋๋ค.
์ ์๋ค์ ํ์ ์ ์ ๊ทผ:
- ๊ทผ๋ณธ ์ง๋ฌธ: โ์ด๊ฒ์ด ์ ํจํ ์ธ์ด ๋ชจ๋ธ ์ถ๋ ฅ์ธ๊ฐ?โ
- ํต์ฌ ์ฐ๊ฒฐ: ์์ฑ์ ๊ฐ ํ๋ณด ์๋ต์ ๋ํด โ์ ํจํ๊ฐ?โ๋ฅผ ๋ฌป๋ ๊ฒ๊ณผ ๋ณธ์ง์ ์ผ๋ก ๋์ผ
- ์ํ์ ๊ด๊ณ: ์์ฑ ์ค๋ฅ์จ โฅ 2 ร IIV ์ค๋ถ๋ฅ์จ
๊ตฌ์ฒด์ ์์:
1
2
3
4
5
6
7
8
9
์ง๋ฌธ: "Adam Kalai์ ์์ผ์?"
๊ฐ๋ฅํ ๋ต๋ณ๋ค:
- "3์ 7์ผ" (์๋ชป๋ ์ถ์ธก)
- "10์ 15์ผ" (์๋ชป๋ ์ถ์ธก)
- "๋ชจ๋ฅด๊ฒ ์ต๋๋ค" (์ ์งํ ๋ต๋ณ)
IIV ๊ด์ : ๋ชจ๋ธ์ด ๊ฐ ๋ต๋ณ์ ๋ํด "์ด๊ฒ์ด ์ ํจํ๊ฐ?"๋ฅผ ํ๋จ
โ ์ด ํ๋จ ๊ณผ์ ์์ ์ค์ํ๋ฉด ํ๊ฐ ๋ฐ์
์ด๋ก ์ ์์:
- ์ด ๋ถ๋ฑ์์ ํ๊ฐ์ด โ์ ๋น๋ก์ดโ ํ์์ด ์๋์ ๋ณด์ฌ์ฃผ๋ ํต์ฌ ๊ฒฐ๊ณผ
- ์์ญ ๋ ๊ฐ ์ฐ๊ตฌ๋ ์ด์ง ๋ถ๋ฅ ์ค๋ฅ ์ด๋ก ์ ํ๊ฐ ๋ถ์์ ์ ์ฉ ๊ฐ๋ฅ
- ํ๊ฐ๋ฅ ์ ์ ๋์ ์ผ๋ก ์์ธกํ๊ณ ํํ์ ์ค์ ํ ์ ์์
4. Section 1.2: ์ฌํํ๋ จ์์ ํ๊ฐ ์ง์์ฑ - ์ฌํ๊ธฐ์ ์ ์์ธ
๊ธฐ์กด ์ฌํํ๋ จ ์ ๊ทผ๋ฒ๊ณผ ๊ทธ ํ๊ณ
์ฌํํ๋ จ์ ์๋ ๋ชฉํ:
AI ์ปค๋ฎค๋ํฐ๋ ํ๊ฐ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด ๋ค์ํ ํํ๋ จ ๊ธฐ๋ฒ๋ค์ ๊ฐ๋ฐํด์์ต๋๋ค:
- RLHF (์ธ๊ฐ ํผ๋๋ฐฑ ๊ฐํํ์ต): ์ธ๊ฐ์ด ์ ํธํ๋ ๋ต๋ณ์ ํ์ต
- Constitutional AI: ํ๋ฒ์ ์์น์ ๋ฐ๋ฅด๋๋ก ํ๋ จ
- ๋ฏธ์ธ์กฐ์ : ๊ณ ํ์ง ๋ฐ์ดํฐ๋ก ์ถ๊ฐ ํ์ต
๊ทธ๋ฐ๋ฐ ์ ํ๊ฐ์ด ๊ณ์ ๋จ์์์๊น?
์ด๋ก ์ ์ผ๋ก๋ ์ด๋ฐ ๊ธฐ๋ฒ๋ค์ด ํ๊ฐ์ ํฌ๊ฒ ์ค์ฌ์ผ ํ๋๋ฐ, ์ค์ ๋ก๋ ์ฌ์ ํ ํ๊ฐ์ด ๋ฐ์ํฉ๋๋ค. ์ ์๋ค์ ์ด ํ์์ ์ฌํ๊ธฐ์ ์ ๊ด์ ์์ ๋ถ์ํฉ๋๋ค.
ํ์-์ํ ์ ์ถ์ ์ฌํ
์ค์ ๊ต์ก ์ํฉ์ ๊ด์ฐฐ:
1
2
3
4
5
6
7
์ํ์ฅ์์:
ํ์: "์ ํํ ๋ชจ๋ฅด๋๊น ์ถ์ธกํด๋ณผ๊ฒ... 1848๋
?"
โ ๋ง์ผ๋ฉด ์ ์, ํ๋ ค๋ ๋น์นธ๋ณด๋ค๋ ๋์
์ผ์์ํ์์:
ํ์: "์ฃ์กํด์, ์ ํํ ๊ธฐ์ต์ด ์ ๋๋ค์"
โ ์ ์งํจ์ด ์ ๋ขฐ๋ฅผ ์์
์ธ์ด ๋ชจ๋ธ์ ํน์ํ ์ํฉ:
-
๊ณผ์ ์ ์ด๊ณ ๊ตฌ์ฒด์ ์ธ ์ถ์ธก: โ9์ 30์ผโ vs โ๊ฐ์ ์ด๋ ๋โ
- ๋ถํ์คํ ๋๋ ๊ตฌ์ฒด์ ๋ ์ง๋ฅผ ์ ์ํ๋ ๊ฒ์ด ๋ โ๊ทธ๋ด๋ฏํดโ ๋ณด์
- ํ์ง๋ง ์ค์ ๋ก๋ ๋ ์ํํ ํ๊ฐ
-
์ด์ง ์ฑ์ ์ ์ต์ ํ ์๋ ฅ: ์ ๋ต 1์ , IDK 0์ ์์คํ ์์ ์ถ์ธก์ด ์ํ์ ์ผ๋ก ์ต์
1 2 3 4
์ํ์ ๊ณ์ฐ: - ๋น์นธ: ํ์คํ 0์ - ์ถ์ธก: 10% ํ๋ฅ ๋ก ๋ง๋ค๋ฉด โ 0.1ร1 + 0.9ร0 = 0.1์ โ ์ถ์ธก์ด ํญ์ ๋ ์ข์ ์ ํ
-
์ธ์ด ๋ชจ๋ธ์ โ์๊ตฌ ์ํ ๋ชจ๋โ: ์ธ๊ฐ๊ณผ ๋ฌ๋ฆฌ โํ์ค์ ํ๊ตโ์์ ๋ถํ์ค์ฑ ํํ์ ๊ฐ์น๋ฅผ ํ์ตํ ๊ธฐํ ์์
์ ์ด๋ฐ ๋น์ ๋ฅผ ์ฌ์ฉํ๋๊ฐ:
ํํ๋ จ ๊ณผ์ ์์๋ ๊ฒฐ๊ตญ ๋ฒค์น๋งํฌ ์ ์๋ก ๋ชจ๋ธ์ ํ๊ฐํ๊ธฐ ๋๋ฌธ์, ๋ชจ๋ธ์ ๊ณ์ โ์ํ์ ๋ณด๋โ ์ํฉ์ ๋์ฌ์์ต๋๋ค.
์ ๋ ฌ๋์ง ์์ ํ๊ฐ์ ๊ตฌ์กฐ์ ๋ฌธ์
ํ์ฌ ํ๊ฐ ์์คํ ์ ๋ฌธ์ ์ :
- ๋๋ถ๋ถ์ ๋ฒค์น๋งํฌ๊ฐ ํ์คํ๋ ์ธ๊ฐ ์ํ ๋ชจ๋ฐฉ: ์ ํ๋, ํต๊ณผ์จ ๋ฑ ์ด์ง ์งํ ์ฌ์ฉ
- MMLU, GPQA, SWE-bench ๋ฑ ์ฃผ์ ๋ฒค์น๋งํฌ๋ค์ด ๋ชจ๋ โ๋งํ๊ธฐโ ๋ฐฉ์
Model A vs Model B ์ฌ๊ณ ์คํ:
๊ตฌ์ฒด์ ์๋๋ฆฌ์ค:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
์ง๋ฌธ: "2023๋
ํํ ๋
ธ๋ฒจ์ ์์์๋?"
Model A (์ ๋ ฌ๋ ๋ชจ๋ธ):
- ํ์คํ ๋: "Moungi Bawendi, Louis Brus, Alexei Ekimov"
- ๋ถํ์คํ ๋: "์ ํํ ์์ง ๋ชปํฉ๋๋ค"
Model B (์ถ์ธก ๋ชจ๋ธ):
- ํ์คํ ๋: "Moungi Bawendi, Louis Brus, Alexei Ekimov"
- ๋ถํ์คํ ๋๋: "Carolyn Bertozzi" (2022๋
์์์๋ก ์ถ์ธก)
๋ฒค์น๋งํฌ ๊ฒฐ๊ณผ:
- ์๊ณ ์๋ ๋ฌธ์ : ๋ ๋ค ๋ง์ (๊ฐ๊ฐ 1์ )
- ๋ชจ๋ฅด๋ ๋ฌธ์ : A๋ 0์ , B๋ ๊ฐ๋ ๋ง์ถฐ์ ์ ์ ํ๋
โ ์ด์ : B๊ฐ ๋ ๋์!
- Model A: ์ ๋ ฌ๋ ๋ชจ๋ธ, ์ฌ๋ฐ๋ฅธ ๋ถํ์ค์ฑ ์ ํธ, ์ ๋ ํ๊ฐํ์ง ์์
- Model B: Model A์ ์ ์ฌํ๋ ๋ถํ์ค์ฑ ํ์ ์์ด ํญ์ โ์ถ์ธกโ
- ์ญ์ค์ ๊ฒฐ๊ณผ: 0-1 ์ฑ์ ์์ Model B๊ฐ Model A๋ณด๋ค ์ฐ์ํ ์ฑ๋ฅ
โ์ ์ผ๋ณ(Epidemic)โ ๊ฐ๋
๋ฌธ์ ์ ์๋์ ๊ท๋ชจ:
์ ์๋ค์ด ์ฃผ์ ๋ฒค์น๋งํฌ๋ฅผ ๋ถ์ํ ๊ฒฐ๊ณผ, 10๊ฐ ์ค 9๊ฐ๊ฐ ์ด๋ฐ ์์ผ๋ก ์ฑ์ ํฉ๋๋ค.
- ๋ถํ์ค์ฑ๊ณผ ๊ธฐ๊ถ์ ์ฒ๋ฒํ๋ ํ๊ฐ๋ค์ ์๋์ ๋ค์
- 1๊ฐ์ ์ข์ ํ๊ฐ vs 9๊ฐ์ ๋์ ํ๊ฐ = ์ฌ์ ํ ์ถ์ธก์ด ์ ๋ฆฌ
์ โ์ ์ผ๋ณโ์ธ๊ฐ:
1
2
3
4
5
6
7
๋น์ :
- 1๊ฐ ๋ณ์: "์ ์งํ๊ฒ ๋ง์๋๋ฆฌ๋ฉด ์ ๋ชจ๋ฅด๊ฒ ์ต๋๋ค"
- 9๊ฐ ๋ณ์: "ํ์คํฉ๋๋ค!" (ํ๋ฆด ์๋ ์์ง๋ง)
ํ์๋ค์ 9๊ฐ ๋ณ์์ ๋ ์ ๋ขฐํ๊ฒ ๋จ
โ ์ ์งํ 1๊ฐ ๋ณ์์ด ๊ฒฝ์์์ ๋ฐ๋ฆผ
โ ๋ชจ๋ ๋ณ์์ด ๊ณผ์ ํ๋ ๋ฐฉํฅ์ผ๋ก ์งํ
๊ธฐ์กด ํด๊ฒฐ์ฑ ์ ํ๊ณ:
- ์์์ ํ๊ฐ ํ๊ฐ๋ก๋ ์ด๋ฌํ ๊ตฌ์กฐ์ ๋ถ๊ท ํ ํด๊ฒฐ ๋ถ๊ฐ๋ฅ
- ์๋ก์ด ํ๊ฐ ํ๊ฐ๋ฅผ 100๊ฐ ๋ง๋ค์ด๋, ๊ธฐ์กด ์ฃผ๋ฅ ํ๊ฐ๋ค์ด ๋ฐ๋์ง ์์ผ๋ฉด ์๋ฏธ ์์
๊ทผ๋ณธ์ ํด๊ฒฐ์ฑ ์ ํ์์ฑ:
- ์ฃผ์ ํ๊ฐ๋ค ์์ฒด์ ์์ ํ์์ฑ
- ๊ฐ๋ณ ํ๊ฐ ํ๊ฐ ์ถ๊ฐ๊ฐ ์๋, ๊ธฐ์กด ์์คํ ์ ๊ตฌ์กฐ์ ๋ณ๊ฒฝ์ด ํ์
- โ์๋ฒฝํ ํ๊ฐ ํ๊ฐโ๋ฅผ ์ฐพ๋ ๊ฒ์ด ์๋๋ผ, ์ฃผ๋ฅ ํ๊ฐ๋ค์ด ํ๊ฐ์ ๋ถ์ถ๊ธฐ์ง ์๋๋ก ํ๋ ๊ฒ์ด ํต์ฌ
๐ Chapter 2: Related Work - ๊ธฐ์กด ์ฐ๊ตฌ์์ ์ฐจ๋ณํ
์ฑํฐ์ ํต์ฌ ๊ธฐ์ฌ
- ๋ณธ ์ฐ๊ตฌ์ ์ด๋ก ์ ๋ ์ฐฝ์ฑ์ ๊ธฐ์กด ์ฐ๊ตฌ์์ ๋ช ํํ ๋น๊ต๋ฅผ ํตํด ์ ์ฆ
- ํ๊ฐ ์ฐ๊ตฌ ๋ถ์ผ์ ๋ณต์ก์ฑ๊ณผ ๋ค๋ฉด์ ํน์ฑ์ ์ฒด๊ณ์ ์ผ๋ก ์ ๋ฆฌ
- ๊ธฐ์กด ํด๊ฒฐ์ฑ ๋ค์ ํ๊ณ๋ฅผ ๋ถ์ํ์ฌ ์๋ก์ด ์ ๊ทผ๋ฒ์ ํ์์ฑ ๋ถ๊ฐ
- ํํ๋ จ ๊ธฐ๋ฒ๋ค์ ๋ถ๋ถ์ ์ฑ๊ณต๊ณผ ๊ทผ๋ณธ์ ํ๊ณ๋ฅผ ๊ท ํ์๊ฒ ํ๊ฐ
์ด ์ฅ์ ๋ณธ ์ฐ๊ตฌ์ ๋
์ฐฝ์ฑ์ ๊ธฐ์กด ์ฐ๊ตฌ๋ค๊ณผ์ ์ฒด๊ณ์ ๋น๊ต๋ฅผ ํตํด ๋ถ๊ฐ์ํค๊ณ , ํ๊ฐ ์ฐ๊ตฌ ๋ถ์ผ์ ๋ณต์ก์ฑ๊ณผ ๋ค๋ฉด์ ํน์ฑ์ ์ข
ํฉ์ ์ผ๋ก ์ ๋ฆฌํฉ๋๋ค.
ํนํ ๋ณธ ์ฐ๊ตฌ๊ฐ ์ ์ํ๋ IIV ํ์์ ์๋ก์๊ณผ ์ฌํ๊ธฐ์ ์ ์ ๊ทผ๋ฒ์ ์ฐจ๋ณ์ฑ์ ๋ช
ํํ ๋๋ฌ๋
๋๋ค.
1. ํ์ ๋ฐฉ๋ฒ๋ก ์ ์ด๋ก ์ ๋ ์ฐฝ์ฑ
์๋ก์ด ํ์์ ์์:
- ์ง๋ํ์ต โ ๋น์ง๋ํ์ต ํ์: ์ด์ง ๋ถ๋ฅ(์ง๋)์์ ๋ฐ๋ ์ถ์ (๋น์ง๋)์ผ๋ก์ ํ์์ด ๋ณธ ์ฐ๊ตฌ์ ํต์ฌ ๊ธฐ์ฌ
- ๊ธฐ์กด ํ์ ๊ธฐ๋ฒ๊ณผ์ ์ฐจ๋ณ์ฑ: ํ์ต ๋ฌธ์ ๊ฐ ํ์ ์์ฒด๋ ํ๋ฆฝ๋ ๋ฐฉ๋ฒ๋ก ์ด์ง๋ง, ํน์ ํ์ ๋ฐฉํฅ์ ์ฐธ์
- Beygelzimer et al. (2016) ์ฐธ์กฐ: ํ ๋ฌธ์ ๊ฐ ๋ค๋ฅธ ๋ฌธ์ ๋ณด๋ค โ์ต์ํ ์ด๋ ค์โ์ ๋ณด์ด๋ ์ ํต์ ๋ฐฉ๋ฒ๋ก ์ ์๋ก์ด ์์ฉ
ํ์์ ์ค์ฉ์ ๊ฐ์น:
- ์์ญ ๋ ๊ฐ ์ถ์ ๋ ์ด์ง ๋ถ๋ฅ ์ค๋ฅ ์ด๋ก ์ ํ๊ฐ ๋ถ์์ ์ง์ ํ์ฉ ๊ฐ๋ฅ
- Domingos (2012)๊ฐ ์ ๋ฆฌํ ๊ธฐ๊ณํ์ต ์ค๋ฅ์ ๋ค๋ฉด์ ํน์ฑ์ ํ๊ฐ์ ์ ์ฉ
2. ํ๊ฐ ์์ธ ์ฐ๊ตฌ์ ๊ธฐ์กด ์ฑ๊ณผ๋ค
Sun et al. (2025)์ ์ข ํฉ์ ์์ธ ๋ถ๋ฅ:
๋ชจ๋ธ ์์ฒด์ ๊ตฌ์กฐ์ ๋ฌธ์ :
- ๋ชจ๋ธ ๊ณผ์ (Model overconfidence) - Yin et al. (2023): ๋ถ์ ํํ ์ ๋ขฐ๋ ์ถ์
- ๋์ฝ๋ฉ ๋ฌด์์์ฑ(Decoding randomness) - Lee et al. (2022): ์์ฑ ๊ณผ์ ์ ํ๋ฅ ์ ํน์ฑ
- ๋ ธ์ถ ํธํฅ(Exposure bias) - Bengio et al. (2015): ํ๋ จ๊ณผ ์ถ๋ก ์ ์ ๋ ฅ ๋ถํฌ ๋ถ์ผ์น
๋ฐ์ดํฐ์ ํ๋ จ ๊ณผ์ ์ ๋ฌธ์ :
- ๊ธด ๊ผฌ๋ฆฌ ํ๋ จ ์ํ(Long-tailed training samples) - Sun et al. (2023): ๋๋ฌผ๊ฒ ๋ํ๋๋ ์ฌ์ค๋ค์ ํ์ต ์ด๋ ค์
- ์ค๋ํ๋ ์ ๋ ฌ ํ๋ จ(Misleading alignment training) - Wei et al. (2023): ๋ถ์ ์ ํ ํํ๋ จ ๋ชฉํ
- ํ์ ์๊ด๊ด๊ณ(Spurious correlations) - Li et al. (2022): ์ฐ์ฐํ ํจํด์ ๋ํ ๊ณผ๋ํ ์์กด
์ํ์ค์ ๋งฅ๋ฝ์ ๋ฌธ์ :
- ๋๋ฉ์ด ํจ๊ณผ(Snowballing effects) - Zhang et al. (2023): ์ด๊ธฐ ์ค๋ฅ๊ฐ ํ์ ์์ฑ์ ๋ฏธ์น๋ ๋์ ์ํฅ
- ์ญ์ ์ ์ฃผ(Reversal curse) - Berglund et al. (2024): โA๋ B์ด๋คโ๋ก ํ๋ จ๋ ๋ชจ๋ธ์ด โB๋ A์ด๋คโ๋ฅผ ํ์ตํ์ง ๋ชปํ๋ ํ์
- ๋งฅ๋ฝ ํ์ด์ฌํน(Context hijacking) - Jeong (2024): ์ ์์ ๋๋ ์ค๋ํ๋ ๋งฅ๋ฝ์ ์ํ ์๋ต ์กฐ์
3. ๊ฐ์ฅ ๋ฐ์ ํ ์ด๋ก ์ ์ฐ๊ตฌ์์ ๊ด๊ณ
Kalai and Vempala (2024)์์ ๋น๊ต:
๊ณตํต์ ๊ณผ ๊ธฐ์ฌ:
- Good-Turing ์ถ์ ๊ธฐ ์ฐ๊ฒฐ: Alan Turing์ ์ฐ์ํ โ๋๋ฝ ์ง๋โ ์ถ์ ์ ํ๊ฐ์ ์ ์ฉ
- Theorem 3์ ์๊ฐ ์ ๊ณต: ๋ณธ ์ฐ๊ตฌ์ ํต์ฌ ์ ๋ฆฌ ์ค ํ๋์ ์ด๋ก ์ ํ ๋
๋ณธ ์ฐ๊ตฌ์ ํ์ฅ๋ ๊ธฐ์ฌ:
- ๋ถํ์ค์ฑ ํํ ํฌํจ: IDK์ ๊ฐ์ ๋ช ์์ ๋ถํ์ค์ฑ ์๋ต ๊ณ ๋ ค
- ์ง๋ํ์ต ์ฐ๊ฒฐ: ์ด์ง ๋ถ๋ฅ์์ ์ํ์ ๊ด๊ณ ์๋ฆฝ
- ํํ๋ จ ์์ ๋ถ์: ์ฌ์ ํ๋ จ ์ดํ ๋จ๊ณ์ ์ฒด๊ณ์ ๋ถ์
- ํ๋กฌํํธ ๋ชจ๋ธ ํฌํจ: ๋งฅ๋ฝ-์๋ต ์์ ํฌํจํ ๋ ํ์ค์ ๋ชจ๋ธ๋ง
- ์ฌํ๊ธฐ์ ์ ํด๊ฒฐ์ฑ : ํ๊ฐ ๋ฐฉ์ ์์ ์ ํตํ ์ค์ฉ์ ์ ๊ทผ
๋ค๋ฅธ ์ด๋ก ์ ์ฐ๊ตฌ๋ค:
Hanneke et al. (2018):
- ์ ํจ์ฑ ์ค๋ผํด ์ฟผ๋ฆฌ: ์ธ๊ฐ ๊ฒ์ฆ์๋ฅผ ํ์ฉํ ๋ํํ ํ์ต ์๊ณ ๋ฆฌ์ฆ
- ํต๊ณ์ ํจ์จ์ฑ: ํฉ๋ฆฌ์ ์ธ ๋ฐ์ดํฐ ์์ผ๋ก ํ๊ฐ ์ต์ํ
- ๊ณ์ฐ์ ๋นํจ์จ์ฑ: ์ค์ฉ์ ๊ตฌํ์ ์ด๋ ค์
์ต๊ทผ ์ด๋ก ์ฐ๊ตฌ๋ค์ ํต์ฌ ํต์ฐฐ:
- Kalavasis et al. (2025): ์ผ๊ด์ฑ(๋ฌดํจ ์ถ๋ ฅ ๋ฐฉ์ง)๊ณผ ํญ(๋ค์ํ๊ณ ์ธ์ด์ ์ผ๋ก ํ๋ถํ ์ฝํ ์ธ ์์ฑ) ๊ฐ์ ๋ณธ์ง์ ํธ๋ ์ด๋์คํ
- Kleinberg and Mullainathan (2024): ๊ด๋ฒ์ํ ์ธ์ด ํด๋์ค์ ๋ํด ํ๋ จ ๋ฐ์ดํฐ๋ฅผ ๋์ด ์ผ๋ฐํํ๋ ๋ชจ๋ธ์ ํ๊ฐํ๊ฑฐ๋ ๋ชจ๋ ๋ถ๊ดด๋ฅผ ๊ฒช์ ์๋ฐ์ ์์์ ์ฆ๋ช
4. ํํ๋ จ ๊ธฐ๋ฒ๋ค์ ์ฑ๊ณผ์ ํ๊ณ
ํจ๊ณผ๊ฐ ์ ์ฆ๋ ๊ธฐ๋ฒ๋ค:
์ธ๊ฐ ํผ๋๋ฐฑ ๊ธฐ๋ฐ ๊ฐํํ์ต ๊ณ์ด:
- RLHF (Reinforcement Learning from Human Feedback) - Ouyang et al. (2022): ์ธ๊ฐ ์ ํธ๋๋ฅผ ํตํ ๋ชจ๋ธ ์ ๋ ฌ
- RLAIF (Reinforcement Learning from AI Feedback) - Bai et al. (2022): AI๊ฐ ์์ฑํ ํผ๋๋ฐฑ ํ์ฉ
- DPO (Direct Preference Optimization) - Rafailov et al. (2023): ๊ฐํํ์ต ์์ด ์ง์ ์ ํธ๋ ์ต์ ํ
ํน์ ์ ํ ํ๊ฐ์ ๋ํ ์ฑ๊ณผ:
- ์๋ชจ๋ก ๊ณผ ์ผ๋ฐ์ ์คํด์ ๋ํ ํ๊ฐ ๊ฐ์ ํจ๊ณผ ์ ์ฆ
- ํ์ง๋ง ๋ชจ๋ ์ ํ์ ํ๊ฐ์ ์์ ํ ์ ๊ฑฐํ์ง๋ ๋ชปํจ
๋ฏธ์ธ์กฐ์ ์ ์ญ์ค์ ๊ฒฐ๊ณผ:
- Gekhman et al. (2024)์ ๋ฐ๊ฒฌ: ์๋ก์ด ์ ๋ณด์ ๋ํ ๋จ์ ๋ฏธ์ธ์กฐ์ ์ด ์ด๊ธฐ์๋ ํ๊ฐ๋ฅ ์ ๊ฐ์์ํค์ง๋ง, ์๊ฐ์ด ์ง๋๋ฉด ๋ค์ ์ฆ๊ฐ
- ์ด๋ ๊ทผ๋ณธ์ ํด๊ฒฐ์ฑ ์ด ์๋ ์์๋ฐฉํธ์ผ ์ ์์์ ์์ฌ
์์ธก ์ ํธ ์ฐ๊ตฌ:
- ์์ฐ์ด ์ฟผ๋ฆฌ์ ๋ด๋ถ ๋ชจ๋ธ ํ์ฑํ: ์ฌ์ค์ ์ ํ์ฑ๊ณผ ๋ชจ๋ธ ๋ถํ์ค์ฑ์ ๋ํ ์์ธก ์ ํธ ์ธ์ฝ๋ฉ (Kadavath et al., 2022)
- ์๋ฏธ๋ก ์ ์ผ๋ก ๊ด๋ จ๋ ์ฟผ๋ฆฌ ๊ฐ ๋ถ์ผ์น: ํ๊ฐ ํ์ง๋ ์ํ์ ํ์ฉ ๊ฐ๋ฅ (Manakul et al., 2023; Xue et al., 2025; Agrawal et al., 2024)
5. ๊ธฐ์กด ์ฐ๊ตฌ๋ค์ ํ๊ณ์ ๋ณธ ์ฐ๊ตฌ์ ์ฐจ๋ณ์ฑ
ํฌ๊ด์ ํด๊ฒฐ์ฑ ๋ค์ ํํฉ:
- Ji et al. (2023), Tian et al. (2024)์ ์๋ฒ ์ด: ๋ค์ํ ํ๊ฐ ์ํ ๋ฐฉ๋ฒ๋ค์ด ๊ฐ๋ฐ๋์์ง๋ง ์ฑํ์ ์ฅ๋ฒฝ ์กด์ฌ
- 2025 AI Index ๋ณด๊ณ ์ (Maslej et al., 2025): ํ๊ฐ ๋ฒค์น๋งํฌ๋ค์ด โAI ์ปค๋ฎค๋ํฐ ๋ด์์ ๊ฒฌ์ธ๋ ฅ์ ์ป๋ ๋ฐ ์ด๋ ค์์ ๊ฒช๊ณ ์์โ
ํ๊ฐ์ ๋ฒค์น๋งํฌ์ ํ๊ณ:
- Bang et al. (2025), Hong et al. (2024): ํฌ๊ด์ ๋ฒค์น๋งํฌ์ ๋ฆฌ๋๋ณด๋๊ฐ ๋์ ๋์์ง๋ง ์ฑํ ์ฅ๋ฒฝ์ ๋ํ ๋ถ์ ๋ถ์กฑ
- ๋ณธ ์ฐ๊ตฌ๊ฐ ์ด๋ฌํ ์ฅ๋ฒฝ์ ๊ทผ๋ณธ ์์ธ์ ์ฌํ๊ธฐ์ ์ ๊ด์ ์์ ๋ถ์
๋ถํ์ค์ฑ ํํ ์ฐ๊ตฌ:
- ์ด์ง ํ์ค์ฑ์ ๋์ด์ ์ ๊ทผ: Mielke et al. (2022), Lin et al. (2022a), Damani et al. (2025)์ ์ ์ง์ ๋ถํ์ค์ฑ ํํ ์ฐ๊ตฌ
- ํ์ฉ๋ก (Pragmatics) ์ฐ๊ตฌ: Ma et al. (2025)์ ๋งฅ๋ฝ์ด ์๋ฏธ๋ฅผ ํ์ฑํ๋ ๋ฐฉ์ ์ฐ๊ตฌ - ์ธ์ด ๋ชจ๋ธ์ ์ ๋ณด ์ ๋ฌ ๊ฐ์ ์ ๋ํ ๊ด๋ จ์ฑ ์ฆ๊ฐ
๐ Chapter 3: Pretraining Errors - ์ฌ์ ํ๋ จ์์์ ์ค๋ฅ ๋ฐ์ ๋ฉ์ปค๋์ฆ
์ฑํฐ์ ํต์ฌ ๊ธฐ์ฌ
- IIV ํ์์ ์ํ์ ์๋ฐ์ฑ: ํ๊ฐ์ ์ด์ง ๋ถ๋ฅ ๋ฌธ์ ๋ก ํ์ํ๋ ์์ ํ ์ด๋ก ์ ํ๋ ์์ํฌ ์ ์
- ๋ค์ธต์ ์ค๋ฅ ๋ถ์: ์์์ ์ฌ์ค, ๋ถ๋ ๋ชจ๋ธ, ๊ณ์ฐ์ ์ด๋ ค์ ๋ฑ ๋ค์ํ ์์ธ์ ์ฒด๊ณ์ ๋ถ๋ฅ
- ์ ๋์ ์์ธก: ์ฑ๊ธํค ๋น์จ๊ณผ ํ๊ฐ๋ฅ ์ฌ์ด์ ๊ตฌ์ฒด์ ์ํ์ ๊ด๊ณ ๊ท๋ช
- ์ผ๋ฐ์ฑ๊ณผ ๊ตฌ์ฒด์ฑ์ ๊ท ํ: ์ผ๋ฐ์ ์ด๋ก ๊ณผ ๊ตฌ์ฒด์ ์์(์ผ์คํญ ๋ชจ๋ธ, ๋ฌธ์ ์ธ๊ธฐ)์ ์กฐํ
์ด ์ฅ์ ๋ณธ ๋ ผ๋ฌธ์ ๊ฐ์ฅ ์ค์ํ ์ด๋ก ์ ๊ธฐ์ฌ์ธ IIV ํ์ ๋ฐฉ๋ฒ์ ์ํ์ ์ผ๋ก ์๋ฐํ๊ฒ ์ ์ํ๊ณ , ์ฌ์ ํ๋ จ ๋จ๊ณ์์ ํ๊ฐ์ด ๋ฐ์ํ๋ ๊ทผ๋ณธ์ ๋ฉ์ปค๋์ฆ์ ๋ค๊ฐ๋๋ก ๋ถ์ํฉ๋๋ค. ๋จ์ํ ์๋์์ฑ ๊ด์ ์ ๋์ด์ ์ผ๋ฐ์ ์ธ ๋ฐ๋ ์ถ์ ๋ฌธ์ ๋ก ์ ๊ทผํ์ฌ ํ๊ฐ์ ํต๊ณ์ ํ์ฐ์ฑ์ ์ฆ๋ช ํฉ๋๋ค.
3.1 ํ๋กฌํํธ๊ฐ ์๋ ํ์ - ๊ธฐ๋ณธ ์ด๋ก ๊ตฌ์ถ
๊ธฐ๋ณธ ์ค์ ์ ์ํ์ ์ ์:
ํ๋ฅ ๋ถํฌ๋ก์์ ๊ธฐ๋ณธ ๋ชจ๋ธ:
- ๊ธฐ๋ณธ ๋ชจ๋ธ pฬ: ์งํฉ X์ ๋ํ ํ๋ฅ ๋ถํฌ
- ์ ์ฒด ์งํฉ ๋ถํ : X = E โช V (์ค๋ฅ ์งํฉ๊ณผ ์ ํจ ์งํฉ์ ์๋ก์ ํฉ์งํฉ)
- ์ค๋ฅ์จ ์ ์:
err:=p^(E)=Prโกxโผp^[xโE]\text{err} := \hat{p}(E) = \Pr_{x \sim \hat{p}}[x \in E]err:=p^โ(E)=Prxโผp^โโ[xโE] - ๋ฌด์ก์ ํ๋ จ ๊ฐ์ : ํ๋ จ ๋ถํฌ p์ ๋ํด p(E) = 0 (๋ชจ๋ ํ๋ จ ๋ฐ์ดํฐ๋ ์ ํจํจ)
IIV ์ด์ง ๋ถ๋ฅ ๋ฌธ์ ์ ํ์์ ๊ตฌ์ฑ:
๋ชฉํ ํจ์ ์ ์:
f:Xโ{โ,+},f(x):={+ifย xโVโifย xโEf : X \rightarrow {-, +}, \quad f(x) := \begin{cases} + & \text{if } x \in V \ - & \text{if } x \in E \end{cases}f:Xโ{โ,+},f(x):={+โโifย xโVifย xโEโ
ํ๋ จ ๋ถํฌ ์ค๊ณ:
D(x):={p(x)/2ifย xโV1/(2โฃEโฃ)ifย xโED(x) := \begin{cases} p(x)/2 & \text{if } x \in V \ 1/(2 | E | ) & \text{if } x \in E \end{cases}D(x):={p(x)/21/(2โฃEโฃ)โifย xโVifย xโEโ |
์ด ๋ถํฌ๋ ์ ํจํ ์์ (ํ๋ จ ๋ฐ์ดํฐ์์ ์ถ์ถ)์ ๊ท ๋ฑํ๊ฒ ๋ฌด์์๋ก ์ ํ๋ ์ค๋ฅ์ 50/50 ํผํฉ์ ๋๋ค.
๋ถ๋ฅ๊ธฐ ๊ตฌ์ฑ๊ณผ ์๊ณ๊ฐ ์ค์ :
f^(x):={+ifย p^(x)>1/โฃEโฃโifย p^(x)โค1/โฃEโฃ\hat{f}(x) := \begin{cases} + & \text{if } \hat{p}(x) > 1/ | E | \ - & \text{if } \hat{p}(x) \leq 1/ | E | \end{cases}f^โ(x):={+โโifย p^โ(x)>1/โฃEโฃifย p^โ(x)โค1/โฃEโฃโ |
ํต์ฌ ๊ฒฐ๊ณผ - Corollary 1:
์์์ ํ๋ จ ๋ถํฌ p(V) = 1๊ณผ ์์์ ๊ธฐ๋ณธ ๋ชจ๋ธ pฬ์ ๋ํด:
errโฅ2โ
erriivโโฃVโฃโฃEโฃโฮด\text{err} \geq 2 \cdot \text{err}_{iiv} - \frac{|V|}{|E|} - \deltaerrโฅ2โ
erriivโโโฃEโฃโฃVโฃโโฮด
์ฌ๊ธฐ์:
- err: ์์ฑ ์ค๋ฅ์จ
- err_iiv: IIV ์ค๋ถ๋ฅ์จ
-
ฮด: ๋ณด์ ์ค์ฐจ = pฬ(A) - p(A) for A := {x โ X pฬ(x) > 1/ E }
๋ถ๋ฑ์์ ์ค์ฉ์ ์๋ฏธ:
-
์์ 2๋ ์๋์ ์ผ๋ก tightํ bound (ํฐ E ์ ์์ ฮด์ ๋ํด err_iiv๋ 1/2์ ๊ฐ๊น์ธ ์ ์๊ณ err โค 1) - ํ์ต ๋ถ๊ฐ๋ฅํ ๊ฐ๋ ๋ค์ ๋ํด์๋ err_iiv๊ฐ ํ์ฐ์ ์ผ๋ก ํฌ๊ณ , ๋ฐ๋ผ์ ๋ชจ๋ ๊ธฐ๋ณธ ๋ชจ๋ธ์ด ์ค๋ฅ๋ฅผ ๋ฒํ ๊ฒ
ํ๊ฐ ์ค๋ฅ๋ก์ ์ ์ฉ:
- ํ๊ฐ์ ์ ์: E๋ฅผ ํ๋ ์ด์์ ๊ทธ๋ด๋ฏํ ๊ฑฐ์ง์ ํฌํจํ๋ ์์ฑ์ ์งํฉ์ผ๋ก ์ค์
- ์ ์ง๋์ง ์์ ์์ฑ: ํ๋ จ ๋ฐ์ดํฐ์ ์ ์ง๋์ง ์์ ์์ฑ๋ ํฌํจ (p(V) = 1 ๊ฐ์ ํ์์ ์ฌ์ค์ ์ค๋ฅ๋ ์ฌ์ค์ ์ผ๋ก ์ ํํ ํ๋ จ ๋ฐ์ดํฐ์ ์ ์ง๋ ์ ์์)
๋ณด์ (Calibration) ๋ถ์์ ์ฌ์ธต ๊ณ ์ฐฐ
๋ณด์ ์ค์ฐจ ฮด์ ํด์:
-
์ธ์ด ์ง์ ๋ถ์: ๊ท ๋ฑ ๋ถํฌ pฬ(x) = 1/ X ๋ก๋ ฮด = 0 ๋ฌ์ฑ ๊ฐ๋ฅ - ๊ฐ์ฌ ๊ฐ๋ฅ์ฑ: ํ๋ จ ์ํ x ~ p์ ์์ฑ ์ํ xฬ ~ pฬ์ ์ฌ์ฉํ์ฌ ฮด ์ถ์ ๊ฐ๋ฅ
- ๋ ์จ ์๋ณด ์ ์ถ: Dawid (1982)์ ๋ณด์ ๊ฐ๋ - ์์ธก ํ๋ฅ ๊ณผ ์ค์ ๋ฐ์๋ฅ ์ ์ผ์น
๊ต์ฐจ ์ํธ๋กํผ ๋ชฉ์ ํจ์์์ ๊ด๊ณ:
ํ์ค ์ฌ์ ํ๋ จ ๋ชฉ์ ํจ์:
L(p^)=Exโผp[โlogโกp^(x)]L(\hat{p}) = E_{x \sim p}[-\log \hat{p}(x)]L(p^โ)=Exโผpโ[โlogp^โ(x)]
์ค์ผ์ผ๋ง์ ํตํ ๋ณด์ ๋ถ์:
ํ๋ฅ ์ ์ธ์ s > 0์ผ๋ก ์ฌ์กฐ์ :
p^s(x)โ{sโ p^(x)ifย p^(x)>1/โฃEโฃp^(x)ifย p^(x)โค1/โฃEโฃ\hat{p}_s(x) \propto \begin{cases} s \cdot \hat{p}(x) & \text{if } \hat{p}(x) > 1/ | E | \ \hat{p}(x) & \text{if } \hat{p}(x) \leq 1/ | E | \end{cases}p^โsโ(x)โ{sโ p^โ(x)p^โ(x)โifย p^โ(x)>1/โฃEโฃifย p^โ(x)โค1/โฃEโฃโ |
ํต์ฌ ํต์ฐฐ:
ฮด=โฃddsL(p^s)โฃs=1โฃ\delta = \left|\frac{d}{ds}L(\hat{p}_s)\bigg|_{s=1}\right|ฮด=โฃโฃโฃโฃโฃโdsdโL(p^โsโ)โฃโฃโฃโฃโฃโs=1โโฃโฃโฃโฃโฃโ
ฮด โ 0์ด๋ฉด s โ 1๋ก ์ฌ์กฐ์ ํ์ฌ ์์ค์ ์ค์ผ ์ ์์ผ๋ฏ๋ก, ์ง์ญ ์ต์๊ฐ์ด ์๋๋๋ค. ๋ฐ๋ผ์ ์ง์ญ ์ต์ ํ๋ ์์ ฮด๋ฅผ ์ฐ์ถํด์ผ ํฉ๋๋ค.
3.2 ํ๋กฌํํธ๊ฐ ์๋ ํ์ - ํ์ค์ ํ์ฅ
ํ๋กฌํํธ ๋ชจ๋ธ์ ํ์์ ์ ์:
- ํ๋กฌํํธ ๋ถํฌ: ฮผ์์ ์ถ์ถ๋ ๋งฅ๋ฝ c โ C
- ์์ ๊ตฌ์กฐ: x = (c, r) (ํ๋กฌํํธ c์ ์๋ต r์ ์)
- ๋งฅ๋ฝ๋ณ ๋ถํ :
-
V_c := {r (c, r) โ V} (์ ํจ ์๋ต) -
E_c := {r (c, r) โ E} (์ค๋ฅ ์๋ต)
-
์กฐ๊ฑด๋ถ ๋ถํฌ๋ก์ ํ์ฅ:
-
ํ๋ จ ๋ถํฌ: p(r c), ๊ธฐ๋ณธ ๋ชจ๋ธ: pฬ(r c) -
๊ฒฐํฉ ๋ถํฌ: p(c, r) := ฮผ(c)p(r c), pฬ(c, r) := ฮผ(c)pฬ(r c)
์ผ๋ฐํ๋ IIV ๋ฌธ์ :
- ๋์ผํ ๋ชฉํ ํจ์: f(x) := + iff x โ V
- ์ผ๋ฐํ๋ ๋ถํฌ D: ๋ฑํ๋ฅ ๋ก x ~ p ๋๋ x = (c, r) for c ~ ฮผ, r โ E_c์์ ๊ท ๋ฑํ๊ฒ ์ ํ
-
์ผ๋ฐํ๋ ๋ถ๋ฅ๊ธฐ: fฬ(c, r) := + iff pฬ(r c) > 1/min_c E_c
Theorem 1 - ์ฃผ์ ์ ๋ฆฌ:
์์์ ํ๋ จ ๋ถํฌ p(V) = 1๊ณผ ์์์ ๊ธฐ๋ณธ ๋ชจ๋ธ pฬ์ ๋ํด:
errโฅ2โ
erriivโmaxโกcโฃVcโฃminโกcโฃEcโฃโฮด\text{err} \geq 2 \cdot \text{err}_{iiv} - \frac{\max_c |V_c|}{\min_c |E_c|} - \deltaerrโฅ2โ
erriivโโmincโโฃEcโโฃmaxcโโฃVcโโฃโโฮด
์ฌ๊ธฐ์ ฮด := | pฬ(A) - p(A) | , A := {(c, r) โ X | pฬ(r | c) > 1/min_c | E_c | } |
3.3 ๊ธฐ๋ณธ ๋ชจ๋ธ์ ์ค๋ฅ ์์ธ๋ค - ๊ตฌ์ฒด์ ๋ถ์
3.3.1 ์์์ ์ฌ์ค ํ๊ฐ - ์ธ์๋ก ์ ๋ถํ์ค์ฑ
์์์ ์ฌ์ค์ ์ํ์ ๋ชจ๋ธ:
Definition 1 (Arbitrary Facts):
๊ณ ์ ๋ ์์๋ค:
- ์์์ ํ๋กฌํํธ ๋ถํฌ ฮผ(c)
- IDK ์๋ต
- ๊ฐ ํ๋กฌํํธ c์ ๋ํด: ์๋ต ์งํฉ R_c, ์๋ต ํ๋ฅ ฮฑ_c โ [0, 1]
๋
๋ฆฝ์ ์ ๋ต ์ ํ:
๊ฐ c์ ๋ํด ๋
๋ฆฝ์ ์ผ๋ก, ๋จ์ผ ์ ๋ต a_c โ R_c๊ฐ ๊ท ๋ฑํ๊ฒ ๋ฌด์์๋ก ์ ํ๋ฉ๋๋ค.
-
p(a_c c) = ฮฑ_c -
p(IDK c) = 1 - ฮฑ_c - ๋ฐ๋ผ์ E_c = R_c \ {a_c}, V_c = {a_c, IDK}
์ฑ๊ธํค ๋น์จ์ ์ ์:
Definition 2 (Singleton rate):
ํ๋กฌํํธ c โ C๊ฐ ์ฑ๊ธํค์ด ๋๋ ์กฐ๊ฑด: N๊ฐ ํ๋ จ ๋ฐ์ดํฐ์์ ๊ธฐ๊ถ ์์ด ์ ํํ ํ ๋ฒ ๋ํ๋จ:
|{i : c^(i) = c โง r^(i) โ IDK}| = 1
์ฑ๊ธํค ์งํฉ์ S โ C๋ผ ํ๋ฉด:
sr=โฃSโฃN\text{sr} = \frac{|S|}{N}sr=NโฃSโฃโ
Turing์ ๋๋ฝ ์ง๋ ์ถ์ ๊ณผ์ ์ฐ๊ฒฐ:
- Alan Turing์ ์ฐ์ํ ์ ๊ทผ: ์ ํํ ํ ๋ฒ ๋ํ๋๋ ์ํ์ ๋น์จ์ ๋ฏธ์ถํ ์ฌ๊ฑด ํ๋ฅ ์ ์ถ์ ์น๋ก ์ฌ์ฉ
- ์ง๊ด: ์ฑ๊ธํค๋ค์ ์ถ๊ฐ ์ํ๋ง์์ ์ผ๋ง๋ ๋ง์ ์๋ก์ด ๊ฒฐ๊ณผ๋ฅผ ๋ง๋ ์ง์ ๋ํ ํ๋ก์ ์ญํ
Theorem 2 (Arbitrary Facts) - ํํ ๋ฐ ์ํ:
์์์ ์ฌ์ค ๋ชจ๋ธ์์, N๊ฐ ํ๋ จ ์ํ์ ๋ฐ์ pฬ๋ฅผ ์ถ๋ ฅํ๋ ์์์ ์๊ณ ๋ฆฌ์ฆ์ ๋ํด, โa = โจacโฉ{cโC}์ N๊ฐ ํ๋ จ ์์ ์ ๋ํด 99% ํ๋ฅ ๋ก:
ํํ:
errโฅsrโ2minโกcโฃEcโฃโ35+6lnโกNNโฮด\text{err} \geq \text{sr} - \frac{2}{\min_c |E_c|} - \frac{35 + 6 \ln N}{\sqrt{N}} - \deltaerrโฅsrโmincโโฃEcโโฃ2โโNโ35+6lnNโโฮด
์ํ: ๋ณด์ ๋ pฬ (ฮด = 0)๋ฅผ ์ถ๋ ฅํ๋ ํจ์จ์ ์๊ณ ๋ฆฌ์ฆ์ด ์กด์ฌํ์ฌ 99% ํ๋ฅ ๋ก:
errโคsrโsrmaxโกcโฃEcโฃ+1+13N\text{err} \leq \text{sr} - \frac{\text{sr}}{\max_c |E_c| + 1} + \frac{13}{\sqrt{N}}errโคsrโmaxcโโฃEcโโฃ+1srโ+Nโ13โ
์ค์ฉ์ ์์ฌ์ :
- 20%์ ์์ผ ์ฌ์ค์ด ์ฌ์ ํ๋ จ ๋ฐ์ดํฐ์์ ์ ํํ ํ ๋ฒ ๋ํ๋๋ฉด, ๊ธฐ๋ณธ ๋ชจ๋ธ์ด ์ต์ 20%์ ์์ผ ์ฌ์ค์์ ํ๊ฐํ ๊ฒ์ผ๋ก ์์
- ์ด๋ ๋น๋์ ํ๊ฐ ์ฌ์ด์ ์ง์ ์ ๊ด๊ณ๋ฅผ ์ํ์ ์ผ๋ก ํ๋ฆฝ
3.3.2 ๋ถ๋ ๋ชจ๋ธ - ํํ๋ ฅ๊ณผ ์ ํฉ์ฑ ๋ฌธ์
Agnostic Learning ํ๋ ์์ํฌ:
์ฃผ์ด์ง ๋ถ๋ฅ๊ธฐ ํจ๋ฐ๋ฆฌ G์ ์ต์ ์ค๋ฅ์จ:
opt(G):=minโกgโGPrโกxโผD[g(x)โ f(x)]โ[0,1]\text{opt}(G) := \min_{g \in G} \Pr_{x \sim D}[g(x) \neq f(x)] \in [0, 1]opt(G):=mingโGโPrxโผDโ[g(x)๎ โ=f(x)]โ[0,1]
์ธ์ด ๋ชจ๋ธ ๊ธฐ๋ฐ ๋ถ๋ฅ๊ธฐ ํจ๋ฐ๋ฆฌ:
๋งค๊ฐ๋ณ์ ฮธ โ ฮ๋ก ๋งค๊ฐํ๋ ์ธ์ด ๋ชจ๋ธ pฬ*ฮธ์ ๋ํด:
\(G := {g*{ฮธ,t} | ฮธ โ ฮ, t โ [0, 1]}\)
gฮธ,t(c,r):={+ifย p^ฮธ(rโฃc)>tโifย p^ฮธ(rโฃc)โคtg_{ฮธ,t}(c, r) := \begin{cases} + & \text{if } \hat{p}_ฮธ(r | c) > t \ - & \text{if } \hat{p}_ฮธ(r | c) \leq t \end{cases}gฮธ,tโ(c,r):={+โโifย p^โฮธโ(rโฃc)>tifย p^โฮธโ(rโฃc)โคtโ |
Theorem 1์์์ ์ง์ ์ ๋์ถ:
errโฅ2โ
opt(G)โmaxโกcโฃVcโฃminโกcโฃEcโฃโฮด\text{err} \geq 2 \cdot \text{opt}(G) - \frac{\max_c |V_c|}{\min_c |E_c|} - \deltaerrโฅ2โ
opt(G)โmincโโฃEcโโฃmaxcโโฃVcโโฃโโฮด
์์ ๋ค์ค ์ ํ ์ฌ๋ก - Theorem 3:
|V_c| = 1 for all c์ด๊ณ C = min_c |E_c| + 1์ด ์ ํ์ง ์๋ผ๋ฉด:
errโฅ2(1โ1C)โ
opt(G)\text{err} \geq 2\left(1 - \frac{1}{C}\right) \cdot \text{opt}(G)errโฅ2(1โC1โ)โ
opt(G)
๊ตฌ์ฒด์ ์์ - ์ผ์คํญ ๋ชจ๋ธ์ ํ๊ณ:
ํ๋กฌํํธ์ ์๋ต ์ค๊ณ:
- cโ = โShe lost it and was completely out ofโฆโ
- cโ = โHe lost it and was completely out ofโฆโ
- rโ = โher mind.โ, rโ = โhis mind.โ
- V{cโ} = E{cโ} = {rโ}, V{cโ} = E{cโ} = {rโ}
Corollary 2:
ฮผ๊ฐ {cโ, cโ}์ ๋ํด ๊ท ๋ฑ๋ถํฌ๋ผ๋ฉด, ์์์ ์ผ์คํญ ๋ชจ๋ธ์ ์ต์ 1/2์ ์์ฑ ์ค๋ฅ์จ์ ๊ฐ์ ธ์ผ ํฉ๋๋ค.
์ฆ๋ช ์ค์ผ์น: C = 2์ด๊ณ ์ผ์คํญ ๋ชจ๋ธ์ ๋ํด opt(G) = 1/2์ด๋ฏ๋ก Theorem 3์์ ์ง์ ๋ฐ๋ผ์ต๋๋ค.
ํ๋์ ์์ - ๋ฌธ์ ์ธ๊ธฐ:
DeepSeek-R1 ์ถ๋ก ๋ชจ๋ธ์ 377-ํ ํฐ ์ฌ๊ณ ๊ณผ์ :
1
2
3
"Let me spell it out: D-E-E-P-S-E-E-K.
First letter: D โ that's one D. Second letter: E โ not D. Third letter: E โ not D...
So, the number of Ds is 1."
ํ ํฐํ์ ํํ์ ๋์ :
ํ๋ ์ธ์ด ๋ชจ๋ธ๋ค์ด ๊ฐ๋ณ ๋ฌธ์๊ฐ ์๋ ํ ํฐ(์: D/EEP/SEE/K)์ผ๋ก ํ๋กฌํํธ๋ฅผ ํํํ๋ ๊ฒ์ด ๋ฌธ์ ์ธ๊ธฐ ์์
์ ํํ์ ํ๊ณ๋ฅผ ๋ณด์ฌ์ค๋๋ค.
3.4 ์ถ๊ฐ์ ์ค๋ฅ ์์ธ๋ค - ํฌ๊ด์ ๋ถ์
๊ณ์ฐ์ ์ด๋ ค์ (Computational Hardness)
์ํธํ์ ์์:
- ์์ ํ ์ํธํ ์์คํ ์์๋ ํจ์จ์ ์๊ณ ๋ฆฌ์ฆ์ด ์ฐ์ฐ๋ณด๋ค ๋์ ์ถ์ธก์ ํ ์ ์์
- Observation 2 (Appendix D): โc์ ๋ณตํธํ๋ ๋ฌด์์ธ๊ฐ?โ ํํ์ ๋ค๋ฃจ๊ธฐ ์ด๋ ค์ด ์ฟผ๋ฆฌ์ Theorem 1 ์ ์ฉ
-
ฮฒ-breaking ๋ณด์ ์ ์ ํ์์ ๋ณด์ ๋ ์ธ์ด ๋ชจ๋ธ์ 1 - ฮฒ - 2/( M - 1) - ฮด ์ด์์ ํ๋ฅ ๋ก ์๋ชป๋ ๋ณตํธํ๋ฅผ ์ถ๋ ฅ
๋ถํฌ ์ด๋ (Distribution Shift)
์ ํต์ ๊ธฐ๊ณํ์ต ๋ฌธ์ :
- ํ๋ จ๊ณผ ํ ์คํธ ๋ฐ์ดํฐ ๋ถํฌ์ divergence (Quiรฑonero-Candela et al., 2009)
- ์ธ์ด ๋ชจ๋ธ์์๋ OOD(Out-of-Distribution) ํ๋กฌํํธ๋ก ๋ํ๋จ
- ์์: โ๊นํธ 1ํ์ด๋์ ๋ฉ 1ํ์ด๋ ์ค ์ด๋ ๊ฒ์ด ๋ ๋ฌด๊ฑฐ์ด๊ฐ?โ ๊ฐ์ ํ๋ จ ๋ฐ์ดํฐ์ ์์ ๋ฒํ ์ง๋ฌธ
GIGO: Garbage In, Garbage Out
ํ๋ จ ๋ฐ์ดํฐ ํ์ง์ ํ๊ณ:
- ๋๊ท๋ชจ ํ๋ จ ์ฝํผ์ค๋ ํ์ฐ์ ์ผ๋ก ๋ง์ ์ฌ์ค์ ์ค๋ฅ ํฌํจ
- ๊ธฐ๋ณธ ๋ชจ๋ธ๋ค์ด ํ๋ จ ๋ฐ์ดํฐ์ ์ค๋ฅ๋ฅผ ๋ณต์ ํ ์ ์์
- Lin et al. (2022b), Levy et al. (2021), Alber et al. (2025)์ ์ฐ๊ตฌ๋ก ์ ์ฆ
ํํ๋ จ์ผ๋ก์ ์์ฐ์ค๋ฌ์ด ์ ํ:
GIGO๋ ์ผ๋ฐ์ ์คํด์ ์๋ชจ๋ก ๊ฐ์ ํน์ GIGO ์ค๋ฅ๋ฅผ ๊ฐ์์ํค๋ ํํ๋ จ์ผ๋ก์ ์์ฐ์ค๋ฌ์ด ์ฐ๊ฒฐ์ ์ ์ ๊ณตํฉ๋๋ค. ํ์ง๋ง ์ผ๋ถ ํ๊ฐ์ ์ง์๋๊ฑฐ๋ ์ฌ์ง์ด ์
ํ๋ ์ ์์ต๋๋ค.
๐ Chapter 4: Post-training and Hallucination - ํํ๋ จ์์์ ํ๊ฐ ์ง์์ฑ
์ฑํฐ์ ํต์ฌ ๊ธฐ์ฌ
- ์ฌํ๊ธฐ์ ์ ์์ธ ๊ท๋ช : ํ๊ฐ ์ง์์ฑ์ ๊ทผ๋ณธ ์์ธ์ด ํ๊ฐ ๋ฐฉ์ ์์ฒด์ ์์์ ์ ์ฆ
- ๊ตฌ์กฐ์ ๋ฌธ์ ์ ๋ํ: ์ฃผ๋ฅ ๋ฒค์น๋งํฌ๋ค์ ๋ฉํ ๋ถ์์ ํตํ ์ด์ง ์ฑ์ ์ ์๋์ ๋น์ค ํ์ธ
- ์ค์ฉ์ ํด๊ฒฐ์ฑ ์ ์: ๊ธฐ์กด ๋ฒค์น๋งํฌ์ ๋จ์ ์์ ์ ํตํ ์ ์ง์ ๊ฐ์ ๋ฐฉ์
- ํ๋ ๋ณด์ ๊ฐ๋ : ์๋ก์ด ํ๊ฐ ํจ๋ฌ๋ค์์ผ๋ก์์ ํ๋ ๋ณด์ ๋์
์ด ์ฅ์ ์ฌ์ ํ๋ จ ์ดํ์๋ ํ๊ฐ์ด ์ง์๋๋ ์ด์ ๋ฅผ ์ฌํ๊ธฐ์ ์ ๊ด์ ์์ ๋ถ์ํ๊ณ , ํ๊ฐ ๋ฐฉ์ ์์ฒด๊ฐ ํ๊ฐ์ ๊ฐํํ๋ค๋ ํต์ฌ ํต์ฐฐ์ ์ ์ํฉ๋๋ค. ๋จ์ํ ๋ ๋์ ํํ๋ จ ์๊ณ ๋ฆฌ์ฆ์ ์ ์ํ๋ ๋์ , ๊ธฐ์กด ํ๊ฐ ์์คํ ์ ๊ตฌ์กฐ์ ๋ฌธ์ ๋ฅผ ์ง์ ํ๊ณ ์ค์ฉ์ ํด๊ฒฐ์ฑ ์ ์ ์ํฉ๋๋ค.
4.1 ํ๊ฐ ๋ฐฉ์์ด ํ๊ฐ์ ๊ฐํํ๋ ๋ฉ์ปค๋์ฆ
์ด์ง ํ๊ฐ์ ๊ตฌ์กฐ์ ๋ฌธ์ ์
์๋ชป๋ ์ด๋ถ๋ฒ์ ๊ฐ์:
ํ์ฌ ์ธ์ด ๋ชจ๋ธ ํ๊ฐ๋ค์ด ๋ถ๊ณผํ๋ ๊ฑฐ์ง ์ ๋ต-์ค๋ต ์ด๋ถ๋ฒ์ ๋ค์๊ณผ ๊ฐ์ ์ ์ฉํ ์๋ต๋ค์ ์ ํ ์ ์๋ฅผ ์ฃผ์ง ์์ต๋๋ค:
- ๋ถํ์ค์ฑ ํํ: โํ์คํ์ง ์์ต๋๋คโ, โ์ ํํ ๋ชจ๋ฅด๊ฒ ์ต๋๋คโ
- ๋ชจํธํ ์ธ๋ถ์ฌํญ ์๋ต: ๋ถํ์คํ ๊ตฌ์ฒด์ ์ ๋ณด ๋์ ํ์คํ ์ผ๋ฐ์ ์ ๋ณด ์ ๊ณต
- ๋ช ํํ ์์ฒญ: โ์ด๋ค ์ข ๋ฅ์ ์ ํ๋ฅผ ๋ง์ํ์๋ ๊ฑด๊ฐ์?โ (ํด๋ํฐ vs ์ ์ ์ ํ)
์ฃผ๋ฅ ์งํ๋ค์ ์ด์ง์ ํน์ฑ:
- ์ ํ๋(Accuracy): ๋ง์/ํ๋ฆผ์ ๋จ์ ์ด๋ถ๋ฒ
- ํต๊ณผ์จ(Pass rate): ๊ธฐ์ค ํต๊ณผ/๋ฏธํต๊ณผ์ ์ด๋ถ๋ฒ
- ์ด๋ฌํ ์งํ๋ค์ด ๋ถ์ผ์ ์ง๋ฐฐ์ ๊ท๋ฒ์์ ์ ์๋ค์ด ๊ฐ์กฐ
Observation 1 - ์ํ์ ์ฆ๋ช
:
์์์ ํ๋กฌํํธ c์ ๋ํด, ์ด์ง ์ฑ์ ์์ ๋ํ ์์์ ๋ถํฌ ฯ*c์์:
\(A\_c \cap \arg\max*{r \in R*c} E*{g\_c \sim \rho\_c}[g\_c(r)] = \emptyset\)
์ฌ๊ธฐ์ A_c โ R_c๋ ๊ทธ๋ด๋ฏํ ๊ธฐ๊ถ ์๋ต๋ค์ ์งํฉ์ ๋๋ค.
์ฆ๋ช ์ ํต์ฌ ์์ด๋์ด:
- ์ด์ง ์ฑ์ ์ g_c์ ๋ํด ๋ชจ๋ r โ A_c๋ g_c(r) = 0
- ํ์ง๋ง R_c \ A_c์์ ์ผ๋ถ rโ์ ๋ํด Pr[g_c(rโ) = 1] > 0
- ๋ฐ๋ผ์ ๊ธฐ๊ถ์ ํญ์ ์ฐจ์ ์ฑ
โ์ ์ผ๋ณ(Epidemic)โ ๊ฐ๋ ์ ์ฌ์ธต ๋ถ์
Model A vs Model B ์ฌ๊ณ ์คํ:
Model A (์ ๋ ฌ๋ ๋ชจ๋ธ)์ ํน์ฑ:
- ์ฌ๋ฐ๋ฅด๊ฒ ๋ถํ์ค์ฑ์ ์ ํธ
- ์ ๋ ํ๊ฐํ์ง ์์
- ํ์คํ์ง ์์ ๋ ์ ์ ํ ๊ธฐ๊ถ
Model B (์ถ์ธก ๋ชจ๋ธ)์ ํน์ฑ:
- Model A์ ์ ์ฌํ์ง๋ง ๋ถํ์ค์ฑ ํ์ ์์
- ๋ถํ์คํ ๋ ํญ์ โ์ต์ ์ ์ถ์ธกโ ์ ๊ณต
- ๊ณผ์ ์ ์ด๊ณ ๊ตฌ์ฒด์ ์ธ ๊ฑฐ์ง ์ ๋ณด ์์ฑ
0-1 ์ฑ์ ์์์ ์ญ์ค์ ๊ฒฐ๊ณผ:
Model B๊ฐ Model A๋ณด๋ค ๋ ๋์ ์ ์๋ฅผ ๋ฐ๊ฒ ๋ฉ๋๋ค:
- Model A: ์ ํํ ๋ต๋ณ์๋ง ์ ์, ๊ธฐ๊ถ์๋ 0์
- Model B: ์ ํํ ๋ต๋ณ + ์ด ์ข์ ์ถ์ธก์ ์ ์
๋ฉํ ํ๊ฐ ๊ฒฐ๊ณผ - Table 2์ ์ฒด๊ณ์ ๋ถ์:
์ ์๋ค์ด ์ฃผ์ ๋ฒค์น๋งํฌ๋ค์ ๋ถ์ํ ๊ฒฐ๊ณผ:
๋ํ์ ์ด์ง ์ฑ์ ๋ฒค์น๋งํฌ๋ค:
- GPQA: ๋ค์ค ์ ํ ์ ํ๋, IDK ํฌ๋ ๋ง ์์
- MMLU-Pro: ๋ค์ค ์ ํ ์ ํ๋, IDK ํฌ๋ ๋ง ์์
- IFEval: ํ๋ก๊ทธ๋๋งคํฑ ์ง์ ๊ฒ์ฆ, IDK ํฌ๋ ๋ง ์์
- Omni-MATH: ๋ฑ๊ฐ์ฑ ์ฑ์ , IDK ํฌ๋ ๋ง ์์
- BBH: ๋ค์ค ์ ํ/์ ํํ ์ผ์น, IDK ํฌ๋ ๋ง ์์
- MATH (L5 split): ๋ฑ๊ฐ์ฑ ์ฑ์ , IDK ํฌ๋ ๋ง ์์
- SWE-bench: ํจ์น๊ฐ ๋จ์ ํ ์คํธ ํต๊ณผ ์ฌ๋ถ, IDK ํฌ๋ ๋ง ์์
์ ์ผํ ์์ธ - WildBench:
- LM ๊ธฐ๋ฐ ๋ฃจ๋ธ๋ฆญ ์ฌ์ฉ (1-10 ์ ์)
- IDK๊ฐ ๋ถ๋ถ์ ํฌ๋ ๋ง ํ๋ ๊ฐ๋ฅ
- ํ์ง๋ง ๋ฌธ์ ์ ์ฑ์ : IDK๋ โ๊ณต์ ํโ ์๋ต๋ณด๋ค ๋ฎ์ ์ ์ (3-4์ vs 5-6์ )
- ๋ฐ๋ผ์ ์ฌ์ ํ ํ๊ฐ์ ๊ฐํํ๋ ๊ตฌ์กฐ
์์ ํ๊ฐ ํ๊ฐ์ ํ๊ณ
์๋์ ๋ถ๊ท ํ ๋ฌธ์ :
- ์ฃผ๋ฅ ํ๊ฐ๋ค์ ์๋์ ๋ค์๊ฐ ์ด์ง ์ฑ์
- ์์์ ํ๊ฐ ์ ์ฉ ํ๊ฐ๋ก๋ ๊ตฌ์กฐ์ ๋ถ๊ท ํ ํด๊ฒฐ ๋ถ๊ฐ๋ฅ
- โ์๋ฒฝํ ํ๊ฐ ํ๊ฐโ๋ฅผ ์ถ๊ตฌํ๋ ๊ธฐ์กด ์ฐ๊ตฌ ๋ฐฉํฅ์ ํ๊ณ ์ง์
๊ทผ๋ณธ ์์ธ์ ์๋ณ:
๋ฌธ์ ๋ ํ๊ฐ ํ๊ฐ์ ๋ถ์กฑ์ด ์๋๋ผ ์ ๋ ฌ๋์ง ์์ ํ๊ฐ์ ๊ณผ๋ค์
๋๋ค.
4.2 ๋ช ์์ ์ ๋ขฐ๋ ๋ชฉํ - ์ค์ฉ์ ํด๊ฒฐ์ฑ
์ธ๊ฐ ์ํ๊ณผ์ ์ ์ฌ์ฑ ๋ถ์
์๋ชป๋ ๋ต๋ณ์ ํจ๋ํฐ๊ฐ ์๋ ์ํ๋ค:
์ ์๋ค์ด ์ค์ ์กด์ฌํ๋ ์ํ ์ฌ๋ก๋ค์ ์ ์:
๊ตญ์ ์ ํ์คํ ์ํ๋ค:
- ์ธ๋: JEE (Joint Entrance Examination), NEET, GATE ์ํ
- ๋ฏธ๊ตญ: ๊ณผ๊ฑฐ์ SAT, AP, GRE ํ ์คํธ
- ์ํ: Mathematical Association of America์ AMC ํ ์คํธ
ํต์ฌ ํน์ง:
- ๋ช ์์ ์ฑ์ ๋ฐฉ์ ๊ณ ์ง: ์ํ ์ง์์ฌํญ์ ๋ช ํํ ๊ธฐ์ฌ
- ์ ๋ขฐ๋ ์๊ณ๊ฐ ์ธ์: ์ํ์๋ค์ด ์ธ์ ์ถ์ธกํ ์ง ์๊ณ ์์
- ํฌ๋ช ํ ์ํ-๋ณด์ ๊ตฌ์กฐ: ์ ๋ต ์ ์ป๋ ์ ์ ๋๋น ์ค๋ต ์ ์๋ ์ ์๊ฐ ๋ช ํ
์ ์ํ๋ ํด๊ฒฐ์ฑ ์ ๊ตฌ์ฒด์ ์ค๊ณ
๋ช
์์ ์ ๋ขฐ๋ ๋ชฉํ ๋ฌธ๊ตฌ:
๊ฐ ์ง๋ฌธ์ ๋ค์๊ณผ ๊ฐ์ ๋ฌธ๊ตฌ๋ฅผ ์ถ๊ฐ:
โt ์ด์ ํ์ ํ ๋๋ง ๋ตํ์์ค. ์ค์๋ t/(1-t) ์ ๊ฐ์ ๋๊ณ , ์ ๋ต์ 1์ , โ๋ชจ๋ฅด๊ฒ ๋คโ๋ 0์ ์ ๋๋ค.โ
์์ฐ์ค๋ฌ์ด ์๊ณ๊ฐ๋ค:
- t = 0.5 (ํจ๋ํฐ 1): 50% ์ด์ ํ์ ํ ๋๋ง ๋ต๋ณ
- t = 0.75 (ํจ๋ํฐ 3): 75% ์ด์ ํ์ ํ ๋๋ง ๋ต๋ณ
- t = 0.9 (ํจ๋ํฐ 9): 90% ์ด์ ํ์ ํ ๋๋ง ๋ต๋ณ
- t = 0 (ํจ๋ํฐ 0): ๊ธฐ์กด ์ด์ง ์ฑ์ = โ๋ถํ์คํด๋ ์ต์ ์ ์ถ์ธก์ ํ๋ผโ
์ํ์ ์ ๋นํ:
๋ต๋ณ์ ๊ธฐ๋๊ฐ์ด IDK(์ ์ 0)๋ฅผ ์ด๊ธฐ๋ ์กฐ๊ฑด:
์ ํ๋ ํ๋ฅ ร 1 + ์ค๋ต ํ๋ฅ ร (-t/(1-t)) > 0
โบ ์ ํ๋ ํ๋ฅ > t
๋ฐ๋ผ์ t๋ฅผ ๋ช ์ํจ์ผ๋ก์จ ๋ชจ๋ธ์ด ์ ํํ t ์ด์ ํ์ ํ ๋๋ง ๋ตํ๋ ๊ฒ์ด ์ํ์ ์ผ๋ก ์ต์ ์ด ๋ฉ๋๋ค.
๊ธฐ์กด ์ ๊ทผ๋ฒ๊ณผ์ ์ฐจ๋ณ์
์ฒซ ๋ฒ์งธ ์ฐจ๋ณ์ - ๋ช ์์ฑ:
- ๊ธฐ์กด ์ฐ๊ตฌ: ๋๋ถ๋ถ ์ ๋ขฐ๋ ๋ชฉํ๋ ํจ๋ํฐ๋ฅผ ์ง์์ฌํญ์์ ์๋ต
- ๋ณธ ์ฐ๊ตฌ: ์ ๋ขฐ๋ ์๊ณ๊ฐ์ ๋ช ์์ ์ผ๋ก ์ง์์ฌํญ์ ํฌํจ
- ์์ธ: Wu et al. (2025)์ โ์ํ ๊ณ ์งโ ํ๋กฌํํธ๋ ๋ช ์์ ํจ๋ํฐ ์ฌ์ฉ
๋ช ์์ฑ์ ์ค์์ฑ:
- ๊ฐ๊ด์ ์ฑ์ ๊ฐ๋ฅ: ์๊ณ๊ฐ์ด ๋ช ์๋์ด ์์ผ๋ฉด ๊ณต์ ํ ํ๊ฐ ๊ธฐ์ค ์ค์
- ํฉ์ ํ์ฑ ์ฉ์ด: ์ธ์ด ๋ชจ๋ธ ๊ฐ๋ฐ์๋ค ๊ฐ ๋ช ํํ ๊ธฐ์ค์ ์ ๊ณต
- ํ์๋ค๋ ๋ถ๊ณต์ ํ๋ค๊ณ ๋๋ผ์ง ์์: ์ฑ์ ๊ธฐ์ค์ด ํฌ๋ช ํ๊ฒ ๊ณต๊ฐ๋จ
๋ ๋ฒ์งธ ์ฐจ๋ณ์ - ์ฃผ๋ฅ ํ๊ฐ ํตํฉ:
- ๊ธฐ์กด ์ฐ๊ตฌ: ์ฃผ๋ก ์ ์ฉ ํ๊ฐ ํ๊ฐ์์ ์์์ ์ค๋ฅ ํจ๋ํฐ ๋์
- ๋ณธ ์ฐ๊ตฌ: SWE-bench ๊ฐ์ ๊ธฐ์กด ์ฃผ๋ฅ ํ๊ฐ์ ์ ๋ขฐ๋ ๋ชฉํ ํตํฉ ์ ์
์ฃผ๋ฅ ํ๊ฐ ํตํฉ์ ์ฅ์ :
- ์ ํ๋-์ค๋ฅ ํธ๋ ์ด๋์คํ ๋ฌธ์ ํด๊ฒฐ
- ์ ์ ํ ๋ถํ์ค์ฑ ํํ์ ๋ํ ํจ๋ํฐ ๊ฐ์
- ํ๊ฐ ์ ์ฉ ํ๊ฐ์ ํจ๊ณผ์ฑ ์ฆํญ
ํ๋ ๋ณด์ (Behavioral Calibration) ๊ฐ๋
๊ธฐ์กด ๋ณด์ ๊ณผ์ ์ฐจ์ด:
- ํ๋ฅ ์ ์ ๋ขฐ๋ ์ถ๋ ฅ: ๋ชจ๋ธ์ด โ87% ํ์ ํฉ๋๋คโ ๊ฐ์ ์์น ์ ๊ณต
- ํ๋ ๋ณด์ : ํน์ ์๊ณ๊ฐ์์ ๊ฐ์ฅ ์ ์ฉํ ์๋ต ํ์ฑ
ํ๋ ๋ณด์ ์ ์ ์:
๋ชจ๋ ์๊ณ๊ฐ์์ ๋์์ ์ต์ ์ธ ํ๋์ด ์กด์ฌ:
ํด๋น ์๊ณ๊ฐ๋ณด๋ค ๋์ ์ ํ๋ ํ๋ฅ ์ ๊ฐ์ง ์์ ์์๋ง ๋ต๋ณํ๊ณ , ๋๋จธ์ง์์๋ IDK ์ถ๋ ฅ
๊ฐ์ฌ ๋ฐ ํ๊ฐ ๋ฐฉ๋ฒ:
- ์๊ณ๊ฐ๋ณ๋ก ์ ํ๋์ ์ค๋ฅ์จ ๋น๊ต
- ์ง์์ ์ผ๋ก ๋ง์ ์ ๋ต ํํ ๋ฐฉ์ ๋ฌธ์ ์ฐํ (Farquhar et al., 2024)
- ๊ธฐ์กด ๋ชจ๋ธ๋ค์ด ํ๋ ๋ณด์ ์ ๋ณด์ด๋์ง ํ์ธ ๊ฐ๋ฅ
๊ฐ๊ด์ ํ๊ฐ๋ก์์ ๊ฐ์น:
ํ๋ ๋ณด์ ์ ๋ชจ๋ธ์ ๋ถํ์ค์ฑ ์ฒ๋ฆฌ ๋ฅ๋ ฅ์ ํ๊ฐํ๋ ์๋ก์ด ๊ฐ๊ด์ ์งํ๋ก ํ์ฉ๋ ์ ์์ต๋๋ค.
๐ Chapter 5: Discussion and Limitations - ์ฐ๊ตฌ์ ํ๊ณ์ ํ์ฅ ๊ฐ๋ฅ์ฑ
์ฑํฐ์ ํต์ฌ ๊ธฐ์ฌ
- ํ๊ณ ์ธ์ ์ ์ ์ง์ฑ: ์ ์๋ ํ๋ ์์ํฌ์ ํ๊ณ๋ฅผ ์จ๊ธฐ์ง ์๊ณ ๋ช ํํ ๊ธฐ์
- ํ์ฅ ๊ฐ๋ฅ์ฑ ์ ์: ๊ฐ ํ๊ณ์ ์ ๋ํ ๊ตฌ์ฒด์ ์ธ ํฅํ ์ฐ๊ตฌ ๋ฐฉํฅ ์ ์
- ์ค์ฉ์ฑ๊ณผ ์ด๋ก ์ ๊ท ํ: ์๋ฒฝํ ์ด๋ก ๋ณด๋ค๋ ์ค์ฉ์ ๊ฐ์ ์ ์ด์
- ๋ฏธ๋ ์ฐ๊ตฌ ์์ ์ค์ : ์ธ์ด์ ๋ณด์ , ํ์ฉ๋ก ์ ๋ฅ๋ ฅ ๋ฑ ์๋ก์ด ์ฐ๊ตฌ ์์ญ ๊ฐ์ฒ
์ด ์ฅ์ ์ ์๋ ์ด๋ก ์ ํ๋ ์์ํฌ์ ์ค์ฉ์ ํด๊ฒฐ์ฑ ์ ์ ์ฉ ๋ฒ์์ ํ๊ณ์ ์ ์ ์งํ๊ณ ๊ท ํ์กํ ์๊ฐ์ผ๋ก ๊ฒํ ํฉ๋๋ค. ๊ฐ ํ๊ณ์ ์ ๋ํด ํฅํ ์ฐ๊ตฌ ๋ฐฉํฅ์ ์ ์ํจ์ผ๋ก์จ, ์ด๋ก ์ ํ์ฅ ๊ฐ๋ฅ์ฑ๊ณผ ์ค์ฉ์ ์ ์ฉ์์์ ๊ณ ๋ ค์ฌํญ๋ค์ ์ฒด๊ณ์ ์ผ๋ก ๋ค๋ฃน๋๋ค.
1. ๊ทธ๋ด๋ฏํจ๊ณผ ๋ฌด์๋ฏธํจ์ ๊ฒฝ๊ณ ๋ฌธ์
ํ์ฌ ํ๋ ์์ํฌ์ ๋ฒ์
๊ทธ๋ด๋ฏํ ๊ฑฐ์ง์ ๋ํ ์ง์ค:
- ํ๊ฐ์ ์ ์: โ๊ทธ๋ด๋ฏํ ๊ฑฐ์งโ
- ๋ฌด์๋ฏธํ ๋ฌธ์์ด์ ํ์ฌ ๋ถ์์์ ์ ์ธ
- ํ์ค์ ๊ทผ๊ฑฐ: ์ต์ฒจ๋จ ์ธ์ด ๋ชจ๋ธ๋ค์ด ๋ฌด์๋ฏธํ ๋ฌธ์์ด์ ๊ฑฐ์ ์์ฑํ์ง ์์
ํ์ฅ๋ ํ๋ ์์ํฌ๋ก์ ์์ ๊ฐ๋ฅ์ฑ
์์ ๋ ๋ถํ ๊ตฌ์กฐ:
์ ์ฒด ์งํฉ์ ์ธ ๋ถ๋ถ์ผ๋ก ํ์ฅ:
- X = N โช E โช V
- N: ๋ฌด์๋ฏธํ ์์ ๋ค (nonsensical examples)
- E: ์ค๋ฅ ์์ ๋ค (error examples)
- V: ์ ํจํ ์์ ๋ค (valid examples)
์์ ๋ ์ ์๋ค:
- err := pฬ(N โช E) (๋ฌด์๋ฏธํจ๊ณผ ์ค๋ฅ๋ฅผ ๋ชจ๋ ํฌํจ)
- D(N) = 0 (ํ๋ จ ๋ถํฌ์์ ๋ฌด์๋ฏธํ ์์ ๋ 0 ํ๋ฅ )
- p(V) = 1 (์ ํจํ ์์ ๋ง ํ๋ จ ๋ฐ์ดํฐ์ ํฌํจ)
์ด๋ก ์ ๊ฐ๊ฑด์ฑ:
์ ์๋ค์ด ๊ฐ์กฐํ๋ ์ค์ํ ์ : Theorem 1์ ์ง์ ๊ณผ ์ฆ๋ช
์ด ์ด ์์ ๋ ์ ์์์๋ ๊ทธ๋๋ก ์ฑ๋ฆฝํ๋ค๋ ๊ฒ์
๋๋ค.
2. ๊ฐ๋ฐฉํ ์์ฑ์ ๋ณต์ก์ฑ
ํ์ฌ ์ฐ๊ตฌ์ ์ด์ ๊ณผ ํ๊ณ
๋จ์ผ ์ฌ์ค์ ์ง๋ฌธ ์ค์ฌ:
- ๋ ผ๋ฌธ์์ ์ ์๋ ๋๋ถ๋ถ์ ์์ ๋ค์ด ๋ช ํํ ๋ต์ด ์๋ ์ง๋ฌธ๋ค
- โAdam Kalai์ ์์ผ์?โ, โ๋ ผ๋ฌธ ์ ๋ชฉ์?โ ๋ฑ
๊ฐ๋ฐฉํ ํ๋กฌํํธ์ ๋์ :
๋ณต์กํ ์์ฑ ์์
์ ์์:
โWrite a biography about [person]โฆโ
์ด๋ฐ ํ๋กฌํํธ์์๋ ๋จ์ผํ โ์ ๋ตโ์ด ์กด์ฌํ์ง ์์ผ๋ฉฐ, ๋ถ๋ถ์ ํ๊ฐ์ด๋ ์ ๋์ ์ฐจ์ด๊ฐ ์กด์ฌํ ์ ์์ต๋๋ค.
ํ๋ ์์ํฌ ํ์ฅ ๋ฐฉ์
๋ณตํฉ์ ํ๊ฐ ์ ์:
- ํ๋ ์ด์์ ๊ฑฐ์ง์ ํฌํจํ๋ ์๋ต์ ์ค๋ฅ๋ก ์ ์
- ํ์ง๋ง ์ด ๊ฒฝ์ฐ ํ๊ฐ์ ์ ๋๋ฅผ ๊ณ ๋ คํ๋ ๊ฒ์ด ์์ฐ์ค๋ฌ์
- ๋ช ๊ฐ์ ์ค๋ฅ๊ฐ ์๋์ง์ ๋ฐ๋ฅธ ์ฐจ๋ฑ์ ๋ถ์ ํ์
๋ฏธ๋ ์ฐ๊ตฌ ๋ฐฉํฅ:
๋ณด๋ค ๋ฏธ๋ฌํ ํ๊ฐ ๋ถ๋ฅ ์ฒด๊ณ์ ์ฐ์์ ํ๊ฐ ์ธก์ ๋ฐฉ๋ฒ ๊ฐ๋ฐ์ ํ์์ฑ์ ์์ฌํฉ๋๋ค.
3. ๊ฒ์๊ณผ ์ถ๋ก ์ ํ๊ณ - ๋ง๋ณํต์น์ฝ์ด ์๋
RAG (Retrieval-Augmented Generation)์ ์ฑ๊ณผ์ ํ๊ณ
๊ธฐ์กด ์ฐ๊ตฌ๋ค์ ์ฑ๊ณผ:
๋ค์์ ์ฐ๊ตฌ๋ค์ด ๊ฒ์ ์ฆ๊ฐ์ด ํ๊ฐ์ ์ค์ธ๋ค๋ ๊ฒ์ ์
์ฆ:
- Lewis et al. (2020): ์ง์ ์ง์ฝ์ NLP ์์ ์์์ RAG
- Shuster et al. (2021): ๋ํ์์์ ๊ฒ์ ์ฆ๊ฐ
- Nakano et al. (2021): WebGPT - ๋ธ๋ผ์ฐ์ ์ง์ ์ง๋ฌธ ๋ต๋ณ
- Zhang and Zhang (2025): RAG ์์คํ ์ ๋ํ ์ต์ ์ข ํฉ ๊ฒํ
๊ตฌ์กฐ์ ํ๊ณ์ ์ง์
Observation 1์ ์ผ๋ฐ์ ์ ์ฉ:
์ ์๋ค์ ํต์ฌ ํต์ฐฐ: Observation 1์ด RAG๋ฅผ ํฌํจํ ์์์ ์ธ์ด ๋ชจ๋ธ์ ์ ์ฉ๋ฉ๋๋ค.
๊ตฌ์ฒด์ ๋ฌธ์ ์ ๋ค:
- ๊ฒ์ ์คํจ ์์ ์ถ์ธก ์๋ ฅ:
- ๊ฒ์์ด ํ์ ์๋ ๋ต๋ณ์ ์ ๊ณตํ์ง ๋ชปํ ๋
- ์ด์ง ์ฑ์ ์์คํ ์ด ์ฌ์ ํ ์ถ์ธก์ ๋ณด์
-
๋ด์ฌ์ ํ๊ฐ์ ๋ํ ๋ฌด๋ ฅํจ:
- ๋ฌธ์ ์ธ๊ธฐ ์์: โDEEPSEEK์ D๊ฐ ๋ช ๊ฐ?โ
- ์ด๋ ์ธ๋ถ ๊ฒ์์ผ๋ก ํด๊ฒฐํ ์ ์๋ ๋ด์ฌ์ ์ถ๋ก ๋ฅ๋ ฅ์ ๋ฌธ์
- ํ ํฐํ ๋ฐฉ์ (D/EEP/SEE/K)๊ณผ ๊ฐ์ ๋ชจ๋ธ ๊ตฌ์กฐ์ ํ๊ณ
-
๊ณ์ฐ์ ์ค๋ฅ๋ค:
- ์ํ์ ๊ณ์ฐ์ด๋ ๋ ผ๋ฆฌ์ ์ถ๋ก ์์์ ์ค์
- ๊ฒ์์ผ๋ก๋ ํด๊ฒฐ๋์ง ์๋ ์ถ๋ก ๊ณผ์ ์ ์ค๋ฅ
4. ์ ์ฌ์ ๋งฅ๋ฝ - ์จ๊ฒจ์ง ์ ๋ณด์ ๋ฌธ์
ํ์ฌ ์ค๋ฅ ์ ์์ ํ๊ณ
ํ๋กฌํํธ-์๋ต ์๋ง์ผ๋ก๋ ํ๋จ ๋ถ๊ฐ๋ฅํ ์ค๋ฅ๋ค:
๊ตฌ์ฒด์ ์์:
์ฌ์ฉ์ ์ง๋ฌธ: โ์ ํ์ ๋ํด ์ง๋ฌธ์ด ์์ต๋๋คโ
๋ชจ๋ธ ์๋ต: ํด๋ํฐ์ ๋ํ ๋ต๋ณ ์ ๊ณต
์ค์ ์๋: ์ ์ ์ ํ์ ๋ํ ์ง๋ฌธ์ด์์
์ด๋ฌํ ๋ชจํธ์ฑ์ ํ๋กฌํํธ์ ์๋ต ์ธ๋ถ์ ๋งฅ๋ฝ์ ์์กดํ๋ฏ๋ก ํ์ฌ ์ค๋ฅ ์ ์์ ๋ง์ง ์์ต๋๋ค.
ํ์ฅ ๊ฐ๋ฅ์ฑ - ์จ๊ฒจ์ง ๋งฅ๋ฝ ๋ชจ๋ธ
์ ์๋๋ ํ์ฅ:
- ์ธ์ด ๋ชจ๋ธ์๊ฒ ์ฃผ์ด์ง์ง ์์ โ์จ๊ฒจ์ง ๋งฅ๋ฝโ ํฌํจ
- ์ค๋ฅ ํ๋จ์๋ ์ฌ์ฉ๋์ง๋ง ๋ชจ๋ธ ์ ๋ ฅ์๋ ํฌํจ๋์ง ์๋ ์ ๋ณด
- Aleatoric uncertainty (์ฐ์ฐ์ ๋ถํ์ค์ฑ)๊ณผ์ ์ฐ๊ฒฐ
์ด๋ก ์ ๋์ :
์ด๋ ํ์ฌ ํ๋ ์์ํฌ๋ฅผ ์๋นํ ๋ณต์กํ๊ฒ ๋ง๋ค์ง๋ง, ๋ ํ์ค์ ์ธ ํ๊ฐ ๋ชจ๋ธ๋ง์ ์ํด์๋ ํฅ๋ฏธ๋ก์ด ํ์ฅ ๋ฐฉํฅ์
๋๋ค.
5. ์๋ชป๋ ์ผ๋ถ๋ฒ - ๋จ์ํ์ ํ๊ณ
ํ์ฌ ๋ถ๋ฅ ์ฒด๊ณ์ ๋ถ์กฑํจ
์ ํ/๋ถ์ ํ/IDK ๋ฒ์ฃผ์ ํ๊ณ:
์ ์๋ค์ ์์ ๋ค์ ํ๋ ์์ํฌ๋ ๋ถ์์ ํจ์ ์์งํ๊ฒ ์ธ์ ํฉ๋๋ค:
- ์ค๋ฅ์ ๋ค์ํ ๊ท๋ชจ: ์ฌ์ํ ์ค์์ ์ฌ๊ฐํ ์ค๋ฅ๋ฅผ ๊ตฌ๋ถํ์ง ์์
- ๋ถํ์ค์ฑ์ ์ ๋: โ์ฝ๊ฐ ๋ถํ์คโ๊ณผ โ์์ ํ ๋ชจ๋ฆโ ์ฌ์ด์ ์ฐจ์ด๋ฅผ ๋ฐ์ํ์ง ๋ชปํจ
- ๋งฅ๋ฝ ์์กด์ ์ ์ ์ฑ: ์ํฉ์ ๋ฐ๋ผ ๋ค๋ฅธ ์๋ต์ด ์ ์ ํ ์ ์์
ํต๊ณ์ ์ด์๊ณผ ์ค์ฉ์ ์ ์ถฉ
์ด๋ก ์ ์ด์ํฅ:
- ๊ฐ ํ๊ฐ๋ฅผ ๋ค์ด์คํธ๋ฆผ ์์ฉ์์์ ์ ํํ ๊ฐ์ ๋ฐฉ์์ผ๋ก ์ฑ์ ํ๋ ๊ฒ
- ํ์ง๋ง ์ด๋ ์์ฉ๋ง๋ค ๋ค๋ฅธ ์ฑ์ ๊ธฐ์ค์ ์๊ตฌํ๋ฏ๋ก ํ์คํ ์ด๋ ค์
์ค์ฉ์ ์ ์ถฉ์:
- ๋ช ์์ ์ ๋ขฐ๋ ๋ชฉํ: ์ ์ด๋ IDK ์ต์ ์ ์ ๊ณตํ๋ ์ค์ฉ์ ์ด๊ณ ๊ฐ๊ด์ ์ธ ์์
- ์๋ชป๋ ์ผ๋ถ๋ฒ vs ์๋ชป๋ ์ด๋ถ๋ฒ: ๋ถ์์ ํ๋๋ผ๋ ์ด๋ถ๋ฒ๋ณด๋ค๋ ๊ฐ์ ๋ ์ ๊ทผ
6. IDK๋ฅผ ๋์ด์ - ๋ถํ์ค์ฑ ํํ์ ๋ค์์ฑ
๋ค์ํ ๋ถํ์ค์ฑ ์ ํธ ๋ฐฉ๋ฒ๋ค
์ธ์ด์ ๋ถํ์ค์ฑ ํํ์ ์คํํธ๋ผ:
- ํค์ง (Hedging): โ์๋ง๋โ, โ~์ธ ๊ฒ ๊ฐ์ต๋๋คโ, โํ์คํ์ง๋ ์์ง๋งโ
- ์ธ๋ถ์ฌํญ ์๋ต: ํ์คํ ์ผ๋ฐ์ ์ ๋ณด๋ ์ ๊ณตํ๋, ๋ถํ์คํ ๊ตฌ์ฒด์ ์ธ๋ถ์ฌํญ์ ์๋ต
- ์ง๋ฌธํ๊ธฐ: โ์ด๋ค ์ข ๋ฅ์ ~์ ๋ง์ํ์๋ ๊ฑด๊ฐ์?โ
- ์กฐ๊ฑด๋ถ ์๋ต: โ๋ง์ฝ ~์ ์๋ฏธํ์ ๋ค๋ฉดโฆโ
์ธ์ด์ ๋ณด์ (Linguistic Calibration)์ ๊ฐ๋ฅ์ฑ
๋ฏธ๋ ์ฐ๊ตฌ ๋ฐฉํฅ:
- Mielke et al. (2022), Damani et al. (2025)์ ์ฐ๊ตฌ์์ ์ ์๋ ์ ์ง์ ๋ถํ์ค์ฑ ํํ
- ๋จ์ํ ํ๋ฅ ์์น๊ฐ ์๋ ์์ฐ์ค๋ฌ์ด ์ธ์ด๋ฅผ ํตํ ์ ๋ขฐ๋ ์ ๋ฌ
ํ์ฉ๋ก ์ ํ์์ ๋ฏธ๋ฌํจ:
Austin (1962), Grice (1975)์ ํ์ฉ๋ก ์ฐ๊ตฌ์์ ๋๋ฌ๋๋ ์ธ์ด์ ๋ณต์ก์ฑ:
- ๋งฅ๋ฝ์ด ์๋ฏธ๋ฅผ ํ์ฑํ๋ ๋ฐฉ์
- ๋ช ์์ ๋ด์ฉ๊ณผ ์์์ ์๋ฏธ ๊ฐ์ ์ฐจ์ด
ํ๋ฅ ์ ์ ๋ขฐ๋ ์ง์ ์ ๋ฌธ์ ์
๋ถ์์ฐ์ค๋ฌ์ด ๋ฐํ์ ์:
โ์นผ๋ผ์ด์ ์์ผ์ด 3์ 7์ผ์ผ ํ๋ฅ ์ 1/365์ ๋๋ค.โ
์ด๋ฐ ํํ์ ๊ธฐ์ ์ ์ผ๋ก๋ ์ ํํ์ง๋ง ์์ฐ์ค๋ฌ์ด ๋ํ์์๋ ์ด์ํฉ๋๋ค.
๋ณธ ๋
ผ๋ฌธ์ ์ง์ค์ :
์ ์๋ค์ โ๋ฌด์์ ๋งํ ๊ฒ์ธ๊ฐโ๋ผ๋ ์ต์์ ๊ฒฐ์ ์ ๋ํ ํต๊ณ์ ์์ธ์ ์ง์คํ๋ฉฐ, ๋ ๋ฏธ๋ฌํ ํ์ฉ๋ก ์ ํํ์ ๋ฏธ๋ ์ฐ๊ตฌ ๊ณผ์ ๋ก ๋จ๊ฒจ๋ก๋๋ค.
๐ Chapter 6: Conclusions - ์ฐ๊ตฌ ์ฑ๊ณผ์ ์ข ํฉ๊ณผ ์ ๋ง
๊ฒฐ๋ก ์ฅ์ ์ ์ฒด ์ฐ๊ตฌ์ ํต์ฌ ์ฑ๊ณผ๋ฅผ ๊ฐ๊ฒฐํ๊ฒ ์์ฝํ๊ณ , ์ธ์ด ๋ชจ๋ธ ๊ฐ๋ฐ๊ณผ ํ๊ฐ์ ๋ฏธ์น ์ฅ๊ธฐ์ ์ํฅ์ ์ ๋งํฉ๋๋ค.
๋จ์ํ ์์ฝ์ ๋์ด์ ์ฐ๊ตฌ์ ์ค์ฉ์ ํจ์์ ๋ถ์ผ ์ ์ฒด์ ๋ฐฉํฅ ์ ํ ๊ฐ๋ฅ์ฑ์ ์ ์ํฉ๋๋ค.
์ฑํฐ์ ํต์ฌ ๊ธฐ์ฌ
- ํตํฉ์ ์ฑ๊ณผ ์์ฝ: ์ด๋ก ์ ๊ธฐ์ฌ์ ์ค์ฉ์ ํด๊ฒฐ์ฑ ์ ๊ท ํ์๊ฒ ์ ๋ฆฌ
- ์คํ ๊ฐ๋ฅ์ฑ ๊ฐ์กฐ: ๋จ์ํ ์์ ์ ํตํ ํฐ ๋ณํ์ ๊ฐ๋ฅ์ฑ ์ ์
- ๋ฏธ๋ ๋น์ ์ ์: ๋ ์ ๋ขฐํ ์ ์๋ AI ์์คํ ์ผ๋ก์ ๋ฐ์ ๋ฐฉํฅ ์ ์
- ํ๋ ์ด๊ตฌ: ์ฐ๊ตฌ ์ปค๋ฎค๋ํฐ์ ๊ตฌ์ฒด์ ํ๋ ๋ฐฉ์ ์ ์
1. ํ๊ฐ ํ์์ ์์ ํ ํ์ ๋นํ
์ฌ์ ํ๋ จ์์ ํํ๋ จ๊น์ง์ ํตํฉ์ ์ดํด
์ด๋ก ์ ๊ธฐ์ฌ์ ํต์ฌ:
- ์ฌ์ ํ๋ จ ๋จ๊ณ: ํ๊ฐ์ด ๋ฐ์ํ๋ ํต๊ณ์ ๋ฉ์ปค๋์ฆ์ ์ํ์ ๊ท๋ช
- ํํ๋ จ ๋จ๊ณ: ํ๊ฐ์ด ์ง์๋๋ ์ฌํ๊ธฐ์ ์ ์์ธ์ ์ฒด๊ณ์ ๋ถ์
- ์ ์ฒด ํ์ดํ๋ผ์ธ: ํ๋ ํ๋ จ ๊ณผ์ ์ ๋ฐ์ ๊ฑธ์น ์์ ํ ์ดํด ์ ๊ณต
์ง๋ํ์ต๊ณผ์ ํํ ๊ด๊ณ ํ๋ฆฝ
ํต์ฌ ํต์ฐฐ์ ์ฌ๊ฐ์กฐ:
- ์ฌ์ ํ๋ จ์์ ์์ฑ ์ค๋ฅ๊ฐ ์ง๋ํ์ต์ ์ค๋ถ๋ฅ์ ํํ๊ด๊ณ์ ์์์ ์ฆ๋ช
- ์ด๋ ์ ๋น๋ก์ด ํ์์ด ์๋์ ์๋ฏธ
- ์์ญ ๋ ๊ฐ ์ถ์ ๋ ๋ถ๋ฅ ์ค๋ฅ ์ด๋ก ์ ํ๊ฐ ๋ถ์์ ์ง์ ํ์ฉ ๊ฐ๋ฅ
๊ต์ฐจ ์ํธ๋กํผ ์์ค ์ต์ํ์ ์์ฐ์ค๋ฌ์ด ๊ฒฐ๊ณผ:
- ํ๊ฐ์ด ๋ชจ๋ธ์ ๊ฒฐํจ์ด๋ ์ค์๊ฐ ์๋, ํ์ค ํ๋ จ ๋ชฉ์ ํจ์์ ์์ฐ์ค๋ฌ์ด ๊ฒฐ๊ณผ์์ ์ ์ฆ
- ์ด๋ ํ๊ฐ์ โ๊ณ ์น ์ ์๋ ๋ฒ๊ทธโ๊ฐ ์๋ โ์ดํดํ๊ณ ๊ด๋ฆฌํด์ผ ํ ํน์ฑโ์ผ๋ก ์ฌ์ ์
2. ํ๊ฐ ๋ฐฉ์์ ๊ทผ๋ณธ์ ๋ฌธ์ ์ง์
๋จ์ผ ํ๊ฐ vs ๊ตฌ์กฐ์ ๋ฌธ์ ์ ๋๋น
โCertainlyโ ํ๊ฐ์์ ๋์กฐ:
์ ์๋ค์ด ์ ์ํ๋ ์ค์ํ ๊ตฌ๋ถ:
- ๋จ์ผ ๋ฌธ์ : โCertainlyโ๋ก ์๋ต์ ์์ํ๋ ์ต๊ด ๊ฐ์ ๊ฒฝ์ฐ
- ๋จ์ผ โCertainlyโ ํ๊ฐ๋ก ํด๊ฒฐ ๊ฐ๋ฅ
- ๋ค๋ฅธ ํ๊ฐ๋ค์ ์ํฅ์ ์ฃผ์ง ์์
- ๊ตฌ์กฐ์ ๋ฌธ์ : ํ๊ฐ์ ๋๋ค์ ์ฃผ๋ฅ ํ๊ฐ๋ค์ด ํ๊ฐ์ ํ๋์ ๋ณด์ํ๋ ๊ตฌ์กฐ
์๋์ ๊ท๋ชจ์ ๋ฌธ์
์์น์ ์๋:
- Table 2์์ ๋ณด์ธ ๋ฐ์ ๊ฐ์ด ์ฃผ์ ๋ฒค์น๋งํฌ๋ค์ ์๋์ ๋ค์๊ฐ ์ด์ง ์ฑ์
- ์์์ ํ๊ฐ ์ ์ฉ ํ๊ฐ๋ก๋ ์ด๋ฌํ ๊ตฌ์กฐ์ ๋ถ๊ท ํ ํด๊ฒฐ ๋ถ๊ฐ๋ฅ
- ํ๊ฐ ์ฐ๊ตฌ์๋ค์ด โ์๋ฒฝํ ํ๊ฐ ํ๊ฐโ ์ถ๊ตฌ์๋ง ์ง์คํ๋ ๊ฒ์ ํ๊ณ
๊ทผ๋ณธ์ ํด๊ฒฐ์ฑ
์ ํ์์ฑ:
๊ฐ๋ณ ํ๊ฐ ํ๊ฐ ์ถ๊ฐ๊ฐ ์๋, ์ฃผ๋ฅ ํ๊ฐ๋ค ์์ฒด์ ์์ ์ด ํ์์ ์
๋๋ค.
3. ์ค์ฉ์ ํด๊ฒฐ์ฑ ์ ์คํ ๊ฐ๋ฅ์ฑ
์ฃผ๋ฅ ํ๊ฐ์ ๋จ์ํ ์์
์ต์ํ์ ๋ณํ๋ก ์ต๋ํ์ ํจ๊ณผ:
- ๊ธฐ์กด ๋ฒค์น๋งํฌ์ ์ง์์ฌํญ ์์ ๋ง์ผ๋ก๋ ํฐ ๋ณํ ๊ฐ๋ฅ
- ์๋ก์ด ํ๊ฐ ๊ฐ๋ฐ์ด๋ ๋ณต์กํ ์๊ณ ๋ฆฌ์ฆ ๋ถํ์
- โt ์ด์ ํ์ ํ ๋๋ง ๋ตํ์์คโ ๊ฐ์ ๊ฐ๋จํ ๋ฌธ๊ตฌ ์ถ๊ฐ
์ธ์ผํฐ๋ธ ์ฌ์ ๋ ฌ์ ๋ฉ์ปค๋์ฆ:
- ์ ์ ํ ๋ถํ์ค์ฑ ํํ์ ์ฒ๋ฒํ๋ ๋์ ๋ณด์ํ๋ ๊ตฌ์กฐ๋ก ์ ํ
- ์ด๋ Model A (์ ๋ ฌ๋ ๋ชจ๋ธ)๊ฐ Model B (์ถ์ธก ๋ชจ๋ธ)๋ณด๋ค ์ฐ์ํ ์ฑ๊ณผ๋ฅผ ๋ด๋๋ก ํจ
- ์ํ์ ์ผ๋ก ์ต์ ํ๋ ์ ๋ขฐ๋ ์๊ณ๊ฐ ์ค์ ์ ํตํ ๊ฐ๊ด์ ํ๊ฐ
4. ํฅํ ์ฐ๊ตฌ ๋ฐฉํฅ์ ์๋ก์ด ์งํ
ํ๊ฐ ์ต์ ์ฅ๋ฒฝ์ ์ ๊ฑฐ
ํ์ฌ ์ํฉ์ ๋ณํ:
- ๊ธฐ์กด: ํํ๋ จ ์๊ณ ๋ฆฌ์ฆ ๊ฐ๋ฐ์๋ ๋ถ๊ตฌํ๊ณ ํ๊ฐ ์ง์
- ๋ณํ ํ: ํ๊ฐ ๋ฐฉ์ ์์ ์ ํตํ ๊ตฌ์กฐ์ ์ฅ๋ฒฝ ์ ๊ฑฐ
- ๊ฒฐ๊ณผ: ๊ธฐ์กด ๋ฐ ๋ฏธ๋์ ํ๊ฐ ์ํ ๊ธฐ๋ฒ๋ค์ ํจ๊ณผ์ฑ ์ฆ๋
๋ฏธ๋ฌํ ์ธ์ด ๋ชจ๋ธ์ ๊ฐ๋ฅ์ฑ
๋ ํ๋ถํ ํ์ฉ๋ก ์ ๋ฅ๋ ฅ:
Ma et al. (2025)์ ํ์ฉ๋ก ์ฐ๊ตฌ์ ์ฐ๊ฒฐํ์ฌ:
- ๋งฅ๋ฝ์ ๋ฐ๋ฅธ ์ ์ ํ ๋ถํ์ค์ฑ ํํ
- ์์ฐ์ค๋ฌ์ด ์ธ์ด๋ฅผ ํตํ ์ ๋ขฐ๋ ์ ๋ฌ
- ์ฌ์ฉ์์์ ๋ ํจ๊ณผ์ ์ธ ์ํต
์ธ์ด์ ๋ณด์ (Linguistic Calibration):
- ํ๋ฅ ์์น๊ฐ ์๋ ์์ฐ์ค๋ฌ์ด ์ธ์ด ํํ์ ํตํ ๋ถํ์ค์ฑ ์ ๋ฌ
- ํ์ฉ๋ก ์ ๋งฅ๋ฝ์ ๊ณ ๋ คํ ์ ์ ํ ์๋ต ์์ฑ
5. ๋ถ์ผ ์ ์ฒด์ ํจ๋ฌ๋ค์ ์ ํ
๋ฆฌ๋๋ณด๋์ ๋ฒค์น๋งํฌ ์ํ๊ณ์ ๋ณํ
์ ์ง์ ๋ณํ์ ์ ๋ต:
- ๊ฐ๋ณ ์ฐ๊ตฌ์๋ ๊ธฐ๊ด์ ๋ ธ๋ ฅ๋ง์ผ๋ก๋ ํ๊ณ
- ์ฌํ๊ธฐ์ ์ ํฉ์๋ฅผ ํตํ ๋ถ์ผ ์ ์ฒด์ ๋ฐฉํฅ ์ ํ ํ์
- ์ํฅ๋ ฅ ์๋ ๋ฆฌ๋๋ณด๋๋ค์ ์ฑํ์ด ํต์ฌ
๋ณํ์ ์ฐ์ ๋ฐ์:
- ์ฃผ์ ๋ฆฌ๋๋ณด๋์์ ๋ช ์์ ์ ๋ขฐ๋ ๋ชฉํ ์ฑํ
- ๋ชจ๋ธ ๊ฐ๋ฐ์๋ค์ด ์๋ก์ด ํ๊ฐ ๊ธฐ์ค์ ๋ง์ถฐ ์ต์ ํ
- ๋ ์ ๋ขฐํ ์ ์๋ ๋ชจ๋ธ๋ค์ด ๊ฒฝ์์์ ์ฐ์
- ์ฌ์ฉ์๋ค์ด ๋ ๋์ ๊ฒฝํ์ ํ๊ฒ ๋จ
๋ ์ ๋ขฐํ ์ ์๋ AI ์์คํ ์ผ๋ก์ ์ ํ
์ฌํ์ ์ํฅ:
- ์๋ฃ, ๋ฒ๋ฅ , ๊ธ์ต ๋ฑ ๊ณ ์ํ ๋๋ฉ์ธ์์์ AI ์ ๋ขฐ์ฑ ํฅ์
- ์ผ๋ฐ ์ฌ์ฉ์๋ค์ AI์ ๋ํ ์ ๋ขฐ๋ ์ฆ๊ฐ
- AI ์์ ์ฑ์ ๋ํ ์ฌํ์ ์ฐ๋ ค ์ํ
๊ธฐ์ ์ ๋ฐ์ :
- ๋ถํ์ค์ฑ์ ์ ์ ํ ์ฒ๋ฆฌํ๋ ๋ชจ๋ธ ๊ฐ๋ฐ ์ด์ง
- ํ๋ ๋ณด์ ๊ฐ์ ์๋ก์ด ํ๊ฐ ํจ๋ฌ๋ค์ ํ์ฐ
- ํ๊ฐ ์ํ ๊ธฐ์ ๋ค์ ํจ๊ณผ์ฑ ์ฆ๋
๊ฒฐ๋ก ์ ํ๊ฐ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํ โ์ํํโ์ ์ฐพ๋ ๋์ , ์์คํ ์ ์ ๊ทผ์ ํตํ ์ ์ง์ ์ด์ง๋ง ๊ทผ๋ณธ์ ์ธ ๊ฐ์ ์ด ๊ฐ๋ฅํจ์ ๋ณด์ฌ์ค๋๋ค. ์ด๋ ๋จ์ํ ๊ธฐ์ ์ ํด๊ฒฐ์ฑ ์ด ์๋, ์ฌํ๊ธฐ์ ์ ํฉ์๋ฅผ ํตํ ๋ถ์ผ ์ ์ฒด์ ๋ฐ์ ์ ์ถ๊ตฌํ๋ ์ฑ์ํ ์ฐ๊ตฌ ์ ๊ทผ๋ฒ์ ๋ณด์ฌ์ค๋๋ค.
์ฝ์ด์ฃผ์ ์ ๊ฐ์ฌํฉ๋๋ค ๐ธ