[OpenAI] ์–ธ์–ด๋ชจ๋ธ ํ™˜๊ฐ(Hallucination) ํ˜„์ƒ: ์™œ AI๋Š” ํ™•์‹ ์— ์ฐฌ ๊ฑฐ์ง“๋ง์„ ํ• ๊นŒ?

Posted by Euisuk's Dev Log on September 7, 2025

[OpenAI] ์–ธ์–ด๋ชจ๋ธ ํ™˜๊ฐ(Hallucination) ํ˜„์ƒ: ์™œ AI๋Š” ํ™•์‹ ์— ์ฐฌ ๊ฑฐ์ง“๋ง์„ ํ• ๊นŒ?

์›๋ณธ ๊ฒŒ์‹œ๊ธ€: https://velog.io/@euisuk-chung/OpenAI-์–ธ์–ด๋ชจ๋ธ-ํ™˜๊ฐHallucination-ํ˜„์ƒ-์™œ-AI๋Š”-ํ™•์‹ ์—-์ฐฌ-๊ฑฐ์ง“๋ง์„-ํ• ๊นŒ

Source:

ํ•ด๋‹น ๋ธ”๋กœ๊ทธ ํฌ์ŠคํŠธ๋Š” ์œ„ source๋“ค์„ ์ฐธ๊ณ ํ•˜์—ฌ ์ž‘์„ฑํ–ˆ์Šต๋‹ˆ๋‹ค.

Paper - Why Language Models Hallucinate


TL;DR

  • ํ•ด๊ฒฐํ•˜๊ณ ์ž ํ•˜๋Š” ๋ฌธ์ œ์˜ ์ค‘์š”์„ฑ:

    • ๋Œ€ํ˜• ์–ธ์–ด ๋ชจ๋ธ์˜ ํ™˜๊ฐ(hallucination) ํ˜„์ƒ์€ ์‹ ๋ขฐ์„ฑ์„ ํฌ๊ฒŒ ์ €ํ•ดํ•˜๋Š” ํ•ต์‹ฌ ๋ฌธ์ œ
    • ๊ธฐ์กด ์ตœ์ฒจ๋‹จ ๋ชจ๋ธ๋“ค์—์„œ๋„ ์ง€์†์ ์œผ๋กœ ๋ฐœ์ƒํ•˜๋Š” ๊ทผ๋ณธ์  ํ•œ๊ณ„
  • ๊ธฐ์กด ์ ‘๊ทผ๋ฒ•์˜ ํ•œ๊ณ„:

    • ํ™˜๊ฐ์„ ์‹ ๋น„๋กœ์šด ํ˜„์ƒ์œผ๋กœ ๋‹ค๋ฃจ์–ด ๊ทผ๋ณธ ์›์ธ์— ๋Œ€ํ•œ ์ฒด๊ณ„์  ๋ถ„์„ ๋ถ€์กฑ
    • ํ›„ํ›ˆ๋ จ ๊ธฐ๋ฒ•๋“ค์ด ํ™˜๊ฐ์„ ์™„์ „ํžˆ ์ œ๊ฑฐํ•˜์ง€ ๋ชปํ•˜๋Š” ์ด์œ ์— ๋Œ€ํ•œ ๋ช…ํ™•ํ•œ ์„ค๋ช… ๋ถ€์žฌ
  • ์ œ์•ˆํ•˜๋Š” ํ•ด๊ฒฐ์ฑ…์˜ ๋…์ฐฝ์„ฑ:

    • Is-It-Valid (IIV) ์ด์ง„ ๋ถ„๋ฅ˜ ๋ฌธ์ œ๋กœ์˜ ํ™˜์›: ์ƒ์„ฑ ์˜ค๋ฅ˜๋ฅผ ์ด์ง„ ๋ถ„๋ฅ˜ ์˜ค๋ฅ˜์™€ ์—ฐ๊ฒฐํ•˜๋Š” ์ƒˆ๋กœ์šด ์ด๋ก ์  ํ”„๋ ˆ์ž„์›Œํฌ
    • ์‚ฌํšŒ๊ธฐ์ˆ ์  ๊ด€์ : ํ‰๊ฐ€ ๋ฐฉ์‹ ์ž์ฒด๊ฐ€ ํ™˜๊ฐ์„ ๊ฐ•ํ™”ํ•œ๋‹ค๋Š” ํ†ต์ฐฐ
    • ๋ช…์‹œ์  ์‹ ๋ขฐ๋„ ๋ชฉํ‘œ: ๊ธฐ์กด ๋ฒค์น˜๋งˆํฌ ์ˆ˜์ •์„ ํ†ตํ•œ ์‹ค์šฉ์  ํ•ด๊ฒฐ์ฑ… ์ œ์‹œ
  • ์˜ˆ์ƒ๋˜๋Š” ํŒŒ๊ธ‰ํšจ๊ณผ:

    • ์–ธ์–ด ๋ชจ๋ธ ํ›ˆ๋ จ๊ณผ ํ‰๊ฐ€ ํŒจ๋Ÿฌ๋‹ค์ž„์˜ ๊ทผ๋ณธ์  ๋ณ€ํ™” ์œ ๋„
    • ๋” ์‹ ๋ขฐํ•  ์ˆ˜ ์žˆ๋Š” AI ์‹œ์Šคํ…œ ๊ฐœ๋ฐœ์„ ์œ„ํ•œ ์ด๋ก ์  ๊ธฐ๋ฐ˜ ์ œ๊ณต

๐Ÿ“– Chapter 1: Introduction - ํ™˜๊ฐ ํ˜„์ƒ์˜ ๋ณธ์งˆ๊ณผ ์—ฐ๊ตฌ ๋™๊ธฐ

์ฑ•ํ„ฐ์˜ ํ•ต์‹ฌ ๊ธฐ์—ฌ

  1. ํ™˜๊ฐ์„ ์‹ ๋น„๋กœ์šด ํ˜„์ƒ์—์„œ ํ†ต๊ณ„์ ์œผ๋กœ ์ดํ•ด ๊ฐ€๋Šฅํ•œ ํ˜„์ƒ์œผ๋กœ ์žฌ์ •์˜
  2. ์‚ฌ์ „ํ›ˆ๋ จ๊ณผ ํ›„ํ›ˆ๋ จ์˜ ์—ญํ• ์„ ๋ช…ํ™•ํžˆ ๊ตฌ๋ถ„ํ•˜์—ฌ ๋ถ„์„ ํ”„๋ ˆ์ž„์›Œํฌ ์ œ์‹œ
  3. IIV ํ™˜์›์ด๋ผ๋Š” ์ƒˆ๋กœ์šด ์ด๋ก ์  ๋„๊ตฌ ๋„์ž…
  4. ํ‰๊ฐ€ ๋ฐฉ์‹ ์ž์ฒด๊ฐ€ ๋ฌธ์ œ๋ผ๋Š” ์‚ฌํšŒ๊ธฐ์ˆ ์  ํ†ต์ฐฐ ์ œ์‹œ

์„œ๋ก ์€ ํ™˜๊ฐ ํ˜„์ƒ์„ ์ƒˆ๋กœ์šด ๊ด€์ ์—์„œ ๋ฐ”๋ผ๋ณด๋Š” ์ด๋ก ์  ํ‹€์„ ์ œ์‹œํ•˜๋ฉฐ, ๊ธฐ์กด์˜ ์‹ ๋น„๋กœ์šด ํ˜„์ƒ์œผ๋กœ ์—ฌ๊ฒจ์กŒ๋˜ ํ™˜๊ฐ์„ ํ†ต๊ณ„์ ์œผ๋กœ ๋ถ„์„ ๊ฐ€๋Šฅํ•œ ๋ฌธ์ œ๋กœ ์žฌ์ •์˜ํ•ฉ๋‹ˆ๋‹ค. ์ „์ฒด ๋…ผ๋ฌธ์˜ ํ•ต์‹ฌ ์•„์ด๋””์–ด์ธ Is-It-Valid(IIV) ํ™˜์›๊ณผ ์‚ฌํšŒ๊ธฐ์ˆ ์  ํ•ด๊ฒฐ์ฑ…์˜ ๋™๊ธฐ๋ฅผ ๋ช…ํ™•ํžˆ ์ œ์‹œํ•˜๋Š” ์ค‘์š”ํ•œ ๋„์ž…๋ถ€ ์—ญํ• ์„ ํ•ฉ๋‹ˆ๋‹ค.

1. ํ™˜๊ฐ ํ˜„์ƒ์˜ ๊ตฌ์ฒด์  ์ •์˜์™€ ์‹ค์ฆ์  ์ฆ๊ฑฐ

ํ•™์ƒ-์‹œํ—˜ ์œ ์ถ”์˜ ์‹ฌ์ธต ๋ถ„์„:

  • ์ €์ž๋“ค์€ ์šฐ๋ฆฌ๊ฐ€ ์ง๋ฉดํ•˜๊ณ  ์žˆ๋Š” ์–ธ์–ด ๋ชจ๋ธ์˜ ํ™˜๊ฐ์„ โ€œ์–ด๋ ค์šด ์‹œํ—˜ ๋ฌธ์ œ์— ์ง๋ฉดํ•œ ํ•™์ƒ์ด ๋ถˆํ™•์‹คํ•  ๋•Œ ์ถ”์ธกํ•˜๋Š” ํ–‰๋™โ€์— ๋น„์œ ํ•ฉ๋‹ˆ๋‹ค.

  • ์ด ์œ ์ถ”๋Š” ๋‹จ์ˆœํ•œ ์€์œ ๊ฐ€ ์•„๋‹ˆ๋ผ ํ›„๋ฐ˜๋ถ€์—์„œ ์ œ์‹œ๋˜๋Š” ์‚ฌํšŒ๊ธฐ์ˆ ์  ๋ถ„์„์˜ ํ•ต์‹ฌ ํ† ๋Œ€๊ฐ€ ๋ฉ๋‹ˆ๋‹ค
  • ์ถ”์ธก์ด ์ตœ์  ์ „๋žต์ด ๋˜๋Š” ์กฐ๊ฑด:
    • ์ •๋‹ต ์‹œ 1์ , ์˜ค๋‹ต์ด๋‚˜ ๊ณต๋ฐฑ ์‹œ 0์ ์ธ ์ด์ง„ ์ฑ„์  ์‹œ์Šคํ…œ (aka, ์ฐ์–ด์„œ ๋งž์ถ”๋ฉด ์ด๋“์ธ ์‹œ์Šคํ…œ)

๊ตฌ์ฒด์  ํ™˜๊ฐ ์‚ฌ๋ก€์˜ ์ƒ์„ธ ๋ถ„์„:

  • Adam Kalai์˜ ์ƒ์ผ ์งˆ๋ฌธ:

    • DeepSeek-V3 ๋ชจ๋ธ์ด โ€œ์•Œ๊ณ  ์žˆ๋‹ค๋ฉด DD-MM ํ˜•์‹์œผ๋กœ๋งŒ ๋‹ตํ•˜๋ผโ€œ๋Š” ๋ช…ํ™•ํ•œ ์กฐ๊ฑด๋ถ€ ์ง€์‹œ์—๋„ ๋ถˆ๊ตฌํ•˜๊ณ  ์„ธ ๋ฒˆ์˜ ์‹œ๋„์—์„œ ๊ฐ๊ฐ ๋‹ค๋ฅธ ์ž˜๋ชป๋œ ๋‚ ์งœ๋ฅผ ์ œ๊ณต
  • ์‹ค์ œ ์ •๋‹ต:

    • ๊ฐ€์„(Autumn) - ์ด๋Š” ๋ชจ๋ธ์ด ๊ณ„์ ˆ ์ •๋ณด์กฐ์ฐจ ํ™œ์šฉํ•˜์ง€ ๋ชปํ–ˆ์Œ์„ ์‹œ์‚ฌ
  • Table 1์˜ ํ•™์œ„๋…ผ๋ฌธ ์ œ๋ชฉ ํ™˜๊ฐ: ์„ธ ๊ฐœ์˜ ์ธ๊ธฐ ์–ธ์–ด ๋ชจ๋ธ ๋ชจ๋‘ ์™„์ „ํžˆ ๋‹ค๋ฅธ ์ œ๋ชฉ๊ณผ ์—ฐ๋„๋ฅผ ์ƒ์„ฑ

    • ChatGPT(GPT-4o): โ€œBoosting, Online Algorithms, and Other Topics in Machine Learningโ€ (CMU, 2002)
    • DeepSeek: โ€œAlgebraic Methods in Interactive Machine Learningโ€ (Harvard, 2005)
    • Llama: โ€œEfficient Algorithms for Learning and Playing Gamesโ€ (MIT, 2007)
    • ์‹ค์ œ: Kalai (2001)

ํ™˜๊ฐ์˜ ์œ ํ˜•๋ก ์  ๋ถ„๋ฅ˜:

  • ๋‚ด์žฌ์  ํ™˜๊ฐ(Intrinsic hallucinations): ์‚ฌ์šฉ์ž ํ”„๋กฌํ”„ํŠธ์™€ ๋ชจ์ˆœ๋˜๋Š” ๋‚ด์šฉ
  • ์™ธ์žฌ์  ํ™˜๊ฐ(Extrinsic hallucinations): ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ๋‚˜ ์™ธ๋ถ€ ํ˜„์‹ค๊ณผ ๋ชจ์ˆœ๋˜๋Š” ๋‚ด์šฉ

์˜ˆ์ œ Counting Problem :

  • โ€œDEEPSEEK์— D๊ฐ€ ๋ช‡ ๊ฐœ ์žˆ๋Š”๊ฐ€?โ€๋ผ๋Š” ๋‹จ์ˆœํ•œ ์งˆ๋ฌธ์—์„œ๋„ โ€œ2โ€, โ€œ3โ€, โ€œ6โ€, โ€œ7โ€ ๋“ฑ ๋‹ค์–‘ํ•œ ์˜ค๋‹ต ์ƒ์„ฑ

2. ๊ณ„์‚ฐ ํ•™์Šต ์ด๋ก ์  ์ ‘๊ทผ๋ฒ•์˜ ๋„์ž…

ํ˜•์‹์  ์ •์˜์˜ ์ค‘์š”์„ฑ:

ํ™˜๊ฐ์„ ๊ฐ์„ฑ์ ์ด๊ฑฐ๋‚˜ ์ง๊ด€์  ์šฉ์–ด๊ฐ€ ์•„๋‹Œ ์ˆ˜ํ•™์ ์œผ๋กœ ์ •ํ™•ํ•œ ๊ฐœ๋…์œผ๋กœ ์ •์˜

  • ์ „์ฒด ์ง‘ํ•ฉ X: ๋ชจ๋“  ๊ทธ๋Ÿด๋“ฏํ•œ ๋ฌธ์ž์—ด์˜ ์ง‘ํ•ฉ
  • ์˜ค๋ฅ˜ ์ง‘ํ•ฉ E: ๊ทธ๋Ÿด๋“ฏํ•˜์ง€๋งŒ ์ž˜๋ชป๋œ ๋ฌธ์ž์—ด๋“ค
  • ์œ ํšจ ์ง‘ํ•ฉ V: ์˜ฌ๋ฐ”๋ฅธ ๋ฌธ์ž์—ด๋“ค
  • ๋ถ„ํ•  ์กฐ๊ฑด: X=EโˆชVX = E โˆช VX=EโˆชV (์„œ๋กœ์†Œ ์ง‘ํ•ฉ)

๊ณ„์‚ฐ ํ•™์Šต ์ด๋ก  ์—ฐ๊ฒฐ์˜ ์˜์˜:

  • ์ˆ˜์‹ญ ๋…„๊ฐ„ ์ถ•์ ๋œ ๋ถ„๋ฅ˜ ์˜ค๋ฅ˜์— ๋Œ€ํ•œ ์ด๋ก ์  ์ง€์‹์„ ํ™˜๊ฐ ๋ถ„์„์— ํ™œ์šฉ
  • ํ™˜๊ฐ์„ ๋‹จ์ˆœํžˆ โ€œ๊ณ ์ณ์•ผ ํ•  ๋ฌธ์ œโ€œ๊ฐ€ ์•„๋‹Œ โ€œ์ดํ•ดํ•  ์ˆ˜ ์žˆ๋Š” ํ˜„์ƒโ€œ์œผ๋กœ ์ „ํ™˜
  • Kearns and Vazirani (1994)์˜ ์ „ํ†ต์  ๊ณ„์‚ฐ ํ•™์Šต ์ด๋ก ๊ณผ์˜ ๋ช…ํ™•ํ•œ ์—ฐ๊ฒฐ ์„ค์ •

3. Section 1.1: ์‚ฌ์ „ํ›ˆ๋ จ์œผ๋กœ ์ธํ•œ ์˜ค๋ฅ˜ - ํ†ต๊ณ„์  ํ•„์—ฐ์„ฑ

๊ธฐ์กด ํ†ต๋…๊ณผ ๊ทธ ํ•œ๊ณ„

์ผ๋ฐ˜์ ์ธ ํ™˜๊ฐ ์›์ธ ์ถ”์ •:

๋Œ€๋ถ€๋ถ„์˜ ์—ฐ๊ตฌ์ž๋“ค๊ณผ ๊ฐœ๋ฐœ์ž๋“ค์€ ํ™˜๊ฐ์ด ๋‹ค์Œ๊ณผ ๊ฐ™์€ ์ด์œ ๋กœ ๋ฐœ์ƒํ•œ๋‹ค๊ณ  ์ƒ๊ฐํ•ด์™”์Šต๋‹ˆ๋‹ค:

  • ๋ถˆ์™„์ „ํ•œ ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ: ์ธํ„ฐ๋„ท์—์„œ ์ˆ˜์ง‘ํ•œ ๋ฐ์ดํ„ฐ์— ์ž˜๋ชป๋œ ์ •๋ณด๊ฐ€ ํฌํ•จ
  • ๋ถ€์กฑํ•œ ํ›ˆ๋ จ๋Ÿ‰: ๋” ๋งŽ์€ ๋ฐ์ดํ„ฐ์™€ ๋” ๊ธด ํ›ˆ๋ จ์œผ๋กœ ํ•ด๊ฒฐ ๊ฐ€๋Šฅ
  • ๋ชจ๋ธ ํฌ๊ธฐ ํ•œ๊ณ„: ๋” ํฐ ๋ชจ๋ธ์ด๋ฉด ํ™˜๊ฐ์ด ์ค„์–ด๋“ค ๊ฒƒ

์ด๋Ÿฌํ•œ ์ ‘๊ทผ๋ฒ•์˜ ๊ทผ๋ณธ์  ํ•œ๊ณ„:

  • ํ•˜์ง€๋งŒ ์ €์ž๋“ค์€ ์ด๋Ÿฐ โ€œ๋ฐ์ดํ„ฐ ํ’ˆ์งˆ ๊ฐœ์„ โ€ ์ ‘๊ทผ๋ฒ•๋งŒ์œผ๋กœ๋Š” ํ™˜๊ฐ์„ ์™„์ „ํžˆ ํ•ด๊ฒฐํ•  ์ˆ˜ ์—†๋‹ค๊ณ  ์ฃผ์žฅํ•ฉ๋‹ˆ๋‹ค.
  • ์™œ๋ƒํ•˜๋ฉด ์™„๋ฒฝํ•œ ๋ฐ์ดํ„ฐ๋ฅผ ์‚ฌ์šฉํ•ด๋„ ํ™˜๊ฐ์ด ๋ฐœ์ƒํ•˜๊ธฐ ๋•Œ๋ฌธ์ž…๋‹ˆ๋‹ค.

๋ฐ˜์ง๊ด€์  ํ•ต์‹ฌ ์ฃผ์žฅ

์ถฉ๊ฒฉ์ ์ธ ๋ฐœ๊ฒฌ:

  • ์˜ค๋ฅ˜ ์—†๋Š” ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ์—์„œ๋„ ํ†ต๊ณ„์  ๋ชฉ์ ํ•จ์ˆ˜ ์ตœ์ ํ™”๊ฐ€ ์˜ค๋ฅ˜ ์ƒ์„ฑ์œผ๋กœ ์ด์–ด์ง
  • ์ด๋Š” ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ์˜ ์งˆ๊ณผ ๋ฌด๊ด€ํ•˜๊ฒŒ ๋ฐœ์ƒํ•˜๋Š” ๊ตฌ์กฐ์  ๋ฌธ์ œ์ž„์„ ์˜๋ฏธ

์™œ ์ด๊ฒƒ์ด ์ค‘์š”ํ•œ๊ฐ€:

  • ๊ธฐ์กด์—๋Š” โ€œ๋” ๊นจ๋—ํ•œ ๋ฐ์ดํ„ฐโ€๋ฅผ ์ˆ˜์ง‘ํ•˜๋ฉด ํ•ด๊ฒฐ๋  ๋ฌธ์ œ๋กœ ์—ฌ๊ฒจ์กŒ์Šต๋‹ˆ๋‹ค.
  • ํ•˜์ง€๋งŒ ์ €์ž๋“ค์˜ ๋ถ„์„์— ๋”ฐ๋ฅด๋ฉด, ์„ค๋ น ๋ชจ๋“  ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ๊ฐ€ 100% ์ •ํ™•ํ•ด๋„ ์—ฌ์ „ํžˆ ํ™˜๊ฐ์ด ๋ฐœ์ƒํ•  ์ˆ˜๋ฐ–์— ์—†์Šต๋‹ˆ๋‹ค.

์ฆ‰, ํ•™์Šต ๋ฐฉ๋ฒ•์ด ์ž˜๋ชป๋˜์—ˆ๋‹ค๋Š” ๋ง!!

์˜ค๋ฅ˜๋ฅผ ํ”ผํ•˜๋Š” ํ‡ดํ™”๋œ ๋ชจ๋ธ๋“ค์˜ ๋ถ„์„

ํ™˜๊ฐ ์—†๋Š” ๋ชจ๋ธ๋“ค์ด ์™œ ์‹ค์šฉ์ ์ด์ง€ ์•Š์€๊ฐ€:

ํ™˜๊ฐ์ด ์—†๋Š” ๋ชจ๋ธ์€ ํฌ๊ฒŒ 3๊ฐ€์ง€๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค:

  1. โ€œI donโ€™t knowโ€ (IDK) ๋ชจ๋ธ
  1. โ€œํ•ญ์ƒ IDKโ€ ๋ชจ๋ธ:
1
2
3
4
5
์‚ฌ์šฉ์ž: "ํŒŒ๋ฆฌ์˜ ์ˆ˜๋„๋Š” ์–ด๋””์ธ๊ฐ€์š”?"
๋ชจ๋ธ: "๋ชจ๋ฅด๊ฒ ์Šต๋‹ˆ๋‹ค"

์‚ฌ์šฉ์ž: "2+2๋Š”?"
๋ชจ๋ธ: "๋ชจ๋ฅด๊ฒ ์Šต๋‹ˆ๋‹ค"
  • ์˜ค๋ฅ˜๋Š” ํ”ผํ•˜์ง€๋งŒ ๋ฐ€๋„ ์ถ”์ •์ด๋ผ๋Š” ์–ธ์–ด ๋ชจ๋ธ๋ง์˜ ๊ธฐ๋ณธ ๋ชฉํ‘œ์— ์‹คํŒจ
  • ์‹ค์šฉ์„ฑ์ด ์ „๋ฌดํ•˜์—ฌ ์–ธ์–ด ๋ชจ๋ธ๋กœ์„œ ์˜๋ฏธ ์—†์Œ
  1. โ€œ๋‹จ์ˆœ ์•”๊ธฐโ€ ๋ชจ๋ธ:
1
2
์‚ฌ์šฉ์ž: "์˜ค๋Š˜ ๋‚ ์”จ๋Š” ์–ด๋•Œ์š”?"
๋ชจ๋ธ: "Einstein was born in 1879" (ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ์—์„œ ๋ฌด์ž‘์œ„ ์„ ํƒ)
  • ํ›ˆ๋ จ ์˜ˆ์ œ๋ฅผ ๋ฌด์ž‘์œ„๋กœ ๋ฐ˜๋ณต ์ถœ๋ ฅ
  • ์˜ค๋ฅ˜ ์—†๋Š” ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ ๊ฐ€์ • ํ•˜์—์„œ๋Š” ์˜ค๋ฅ˜ ์ƒ์„ฑ ์•ˆํ•จ
  • ํ•˜์ง€๋งŒ ์ƒˆ๋กœ์šด ์ž…๋ ฅ์— ๋Œ€ํ•œ ์ผ๋ฐ˜ํ™” ๋Šฅ๋ ฅ ์ „๋ฌด
  1. โ€œ์ตœ์  ๋ชจ๋ธโ€ pฬ‚ = p:
    • ํ›ˆ๋ จ ๋ถ„ํฌ์™€ ์™„์ „ํžˆ ์ผ์น˜ํ•˜๋Š” ์ด๋ก ์  ์ตœ์  ๋ชจ๋ธ
    • ํ˜„์‹ค์ ์œผ๋กœ ๋‹ฌ์„ฑ ๋ถˆ๊ฐ€๋Šฅํ•œ ๋ฌดํ•œํ•œ ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ ์š”๊ตฌ
    • ๊ณ„์‚ฐ์ ์œผ๋กœ๋„ ์‹คํ˜„ ๋ถˆ๊ฐ€๋Šฅ

ํ•ต์‹ฌ ํ†ต์ฐฐ: ์‹ค์šฉ์ ์ธ ์–ธ์–ด ๋ชจ๋ธ์ด๋ฉด์„œ ๋™์‹œ์— ํ™˜๊ฐ์„ ์™„์ „ํžˆ ํ”ผํ•˜๋Š” ๋ชจ๋ธ์€ ์กด์žฌํ•  ์ˆ˜ ์—†์Šต๋‹ˆ๋‹ค.

IIV(Is-It-Valid) ํ•ต์‹ฌ ํ†ต์ฐฐ

๊ธฐ์กด ์ ‘๊ทผ๋ฒ•์˜ ๋ฌธ์ œ์ :
ํ™˜๊ฐ์„ ์‹ ๋น„๋กœ์šด ํ˜„์ƒ์œผ๋กœ ๋‹ค๋ฃจ์–ด ๊ทผ๋ณธ ์›์ธ์„ ํŒŒ์•…ํ•˜๊ธฐ ์–ด๋ ค์› ์Šต๋‹ˆ๋‹ค.

์ €์ž๋“ค์˜ ํ˜์‹ ์  ์ ‘๊ทผ:

  • ๊ทผ๋ณธ ์งˆ๋ฌธ: โ€œ์ด๊ฒƒ์ด ์œ ํšจํ•œ ์–ธ์–ด ๋ชจ๋ธ ์ถœ๋ ฅ์ธ๊ฐ€?โ€
  • ํ•ต์‹ฌ ์—ฐ๊ฒฐ: ์ƒ์„ฑ์€ ๊ฐ ํ›„๋ณด ์‘๋‹ต์— ๋Œ€ํ•ด โ€œ์œ ํšจํ•œ๊ฐ€?โ€๋ฅผ ๋ฌป๋Š” ๊ฒƒ๊ณผ ๋ณธ์งˆ์ ์œผ๋กœ ๋™์ผ
  • ์ˆ˜ํ•™์  ๊ด€๊ณ„: ์ƒ์„ฑ ์˜ค๋ฅ˜์œจ โ‰ฅ 2 ร— IIV ์˜ค๋ถ„๋ฅ˜์œจ

๊ตฌ์ฒด์  ์˜ˆ์‹œ:

1
2
3
4
5
6
7
8
9
์งˆ๋ฌธ: "Adam Kalai์˜ ์ƒ์ผ์€?"

๊ฐ€๋Šฅํ•œ ๋‹ต๋ณ€๋“ค:
- "3์›” 7์ผ" (์ž˜๋ชป๋œ ์ถ”์ธก)
- "10์›” 15์ผ" (์ž˜๋ชป๋œ ์ถ”์ธก)  
- "๋ชจ๋ฅด๊ฒ ์Šต๋‹ˆ๋‹ค" (์ •์งํ•œ ๋‹ต๋ณ€)

IIV ๊ด€์ : ๋ชจ๋ธ์ด ๊ฐ ๋‹ต๋ณ€์— ๋Œ€ํ•ด "์ด๊ฒƒ์ด ์œ ํšจํ•œ๊ฐ€?"๋ฅผ ํŒ๋‹จ
โ†’ ์ด ํŒ๋‹จ ๊ณผ์ •์—์„œ ์‹ค์ˆ˜ํ•˜๋ฉด ํ™˜๊ฐ ๋ฐœ์ƒ

์ด๋ก ์  ์˜์˜:

  • ์ด ๋ถ€๋“ฑ์‹์€ ํ™˜๊ฐ์ด โ€œ์‹ ๋น„๋กœ์šดโ€ ํ˜„์ƒ์ด ์•„๋‹˜์„ ๋ณด์—ฌ์ฃผ๋Š” ํ•ต์‹ฌ ๊ฒฐ๊ณผ
  • ์ˆ˜์‹ญ ๋…„๊ฐ„ ์—ฐ๊ตฌ๋œ ์ด์ง„ ๋ถ„๋ฅ˜ ์˜ค๋ฅ˜ ์ด๋ก ์„ ํ™˜๊ฐ ๋ถ„์„์— ์ ์šฉ ๊ฐ€๋Šฅ
  • ํ™˜๊ฐ๋ฅ ์„ ์ •๋Ÿ‰์ ์œผ๋กœ ์˜ˆ์ธกํ•˜๊ณ  ํ•˜ํ•œ์„ ์„ค์ •ํ•  ์ˆ˜ ์žˆ์Œ

4. Section 1.2: ์‚ฌํ›„ํ›ˆ๋ จ์—์„œ ํ™˜๊ฐ ์ง€์†์„ฑ - ์‚ฌํšŒ๊ธฐ์ˆ ์  ์›์ธ

๊ธฐ์กด ์‚ฌํ›„ํ›ˆ๋ จ ์ ‘๊ทผ๋ฒ•๊ณผ ๊ทธ ํ•œ๊ณ„

์‚ฌํ›„ํ›ˆ๋ จ์˜ ์›๋ž˜ ๋ชฉํ‘œ:

AI ์ปค๋ฎค๋‹ˆํ‹ฐ๋Š” ํ™˜๊ฐ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด ๋‹ค์–‘ํ•œ ํ›„ํ›ˆ๋ จ ๊ธฐ๋ฒ•๋“ค์„ ๊ฐœ๋ฐœํ•ด์™”์Šต๋‹ˆ๋‹ค:

  • RLHF (์ธ๊ฐ„ ํ”ผ๋“œ๋ฐฑ ๊ฐ•ํ™”ํ•™์Šต): ์ธ๊ฐ„์ด ์„ ํ˜ธํ•˜๋Š” ๋‹ต๋ณ€์„ ํ•™์Šต
  • Constitutional AI: ํ—Œ๋ฒ•์  ์›์น™์„ ๋”ฐ๋ฅด๋„๋ก ํ›ˆ๋ จ
  • ๋ฏธ์„ธ์กฐ์ •: ๊ณ ํ’ˆ์งˆ ๋ฐ์ดํ„ฐ๋กœ ์ถ”๊ฐ€ ํ•™์Šต

๊ทธ๋Ÿฐ๋ฐ ์™œ ํ™˜๊ฐ์ด ๊ณ„์† ๋‚จ์•„์žˆ์„๊นŒ?

์ด๋ก ์ ์œผ๋กœ๋Š” ์ด๋Ÿฐ ๊ธฐ๋ฒ•๋“ค์ด ํ™˜๊ฐ์„ ํฌ๊ฒŒ ์ค„์—ฌ์•ผ ํ•˜๋Š”๋ฐ, ์‹ค์ œ๋กœ๋Š” ์—ฌ์ „ํžˆ ํ™˜๊ฐ์ด ๋ฐœ์ƒํ•ฉ๋‹ˆ๋‹ค. ์ €์ž๋“ค์€ ์ด ํ˜„์ƒ์„ ์‚ฌํšŒ๊ธฐ์ˆ ์  ๊ด€์ ์—์„œ ๋ถ„์„ํ•ฉ๋‹ˆ๋‹ค.

ํ•™์ƒ-์‹œํ—˜ ์œ ์ถ”์˜ ์‹ฌํ™”

์‹ค์ œ ๊ต์œก ์ƒํ™ฉ์˜ ๊ด€์ฐฐ:

1
2
3
4
5
6
7
์‹œํ—˜์žฅ์—์„œ:
ํ•™์ƒ: "์ •ํ™•ํžˆ ๋ชจ๋ฅด๋‹ˆ๊นŒ ์ถ”์ธกํ•ด๋ณผ๊ฒŒ... 1848๋…„?"
โ†’ ๋งž์œผ๋ฉด ์ ์ˆ˜, ํ‹€๋ ค๋„ ๋นˆ์นธ๋ณด๋‹ค๋Š” ๋‚˜์Œ

์ผ์ƒ์ƒํ™œ์—์„œ:
ํ•™์ƒ: "์ฃ„์†กํ•ด์š”, ์ •ํ™•ํžˆ ๊ธฐ์–ต์ด ์•ˆ ๋‚˜๋„ค์š”"
โ†’ ์ •์งํ•จ์ด ์‹ ๋ขฐ๋ฅผ ์Œ“์Œ

์–ธ์–ด ๋ชจ๋ธ์˜ ํŠน์ˆ˜ํ•œ ์ƒํ™ฉ:

  • ๊ณผ์‹ ์ ์ด๊ณ  ๊ตฌ์ฒด์ ์ธ ์ถ”์ธก: โ€œ9์›” 30์ผโ€ vs โ€œ๊ฐ€์„ ์–ด๋А ๋•Œโ€

    • ๋ถˆํ™•์‹คํ•  ๋•Œ๋„ ๊ตฌ์ฒด์  ๋‚ ์งœ๋ฅผ ์ œ์‹œํ•˜๋Š” ๊ฒƒ์ด ๋” โ€œ๊ทธ๋Ÿด๋“ฏํ•ดโ€ ๋ณด์ž„
    • ํ•˜์ง€๋งŒ ์‹ค์ œ๋กœ๋Š” ๋” ์œ„ํ—˜ํ•œ ํ™˜๊ฐ
  • ์ด์ง„ ์ฑ„์ ์˜ ์ตœ์ ํ™” ์••๋ ฅ: ์ •๋‹ต 1์ , IDK 0์  ์‹œ์Šคํ…œ์—์„œ ์ถ”์ธก์ด ์ˆ˜ํ•™์ ์œผ๋กœ ์ตœ์ 

    1
    2
    3
    4
    
    ์ˆ˜ํ•™์  ๊ณ„์‚ฐ:
    - ๋นˆ์นธ: ํ™•์‹คํ•œ 0์ 
    - ์ถ”์ธก: 10% ํ™•๋ฅ ๋กœ ๋งž๋‹ค๋ฉด โ†’ 0.1ร—1 + 0.9ร—0 = 0.1์ 
    โ†’ ์ถ”์ธก์ด ํ•ญ์ƒ ๋” ์ข‹์€ ์„ ํƒ
    
  • ์–ธ์–ด ๋ชจ๋ธ์˜ โ€œ์˜๊ตฌ ์‹œํ—˜ ๋ชจ๋“œโ€: ์ธ๊ฐ„๊ณผ ๋‹ฌ๋ฆฌ โ€œํ˜„์‹ค์˜ ํ•™๊ตโ€์—์„œ ๋ถˆํ™•์‹ค์„ฑ ํ‘œํ˜„์˜ ๊ฐ€์น˜๋ฅผ ํ•™์Šตํ•  ๊ธฐํšŒ ์—†์Œ

์™œ ์ด๋Ÿฐ ๋น„์œ ๋ฅผ ์‚ฌ์šฉํ•˜๋Š”๊ฐ€:
ํ›„ํ›ˆ๋ จ ๊ณผ์ •์—์„œ๋„ ๊ฒฐ๊ตญ ๋ฒค์น˜๋งˆํฌ ์ ์ˆ˜๋กœ ๋ชจ๋ธ์„ ํ‰๊ฐ€ํ•˜๊ธฐ ๋•Œ๋ฌธ์—, ๋ชจ๋ธ์€ ๊ณ„์† โ€œ์‹œํ—˜์„ ๋ณด๋Š”โ€ ์ƒํ™ฉ์— ๋†“์—ฌ์žˆ์Šต๋‹ˆ๋‹ค.

์ •๋ ฌ๋˜์ง€ ์•Š์€ ํ‰๊ฐ€์˜ ๊ตฌ์กฐ์  ๋ฌธ์ œ

ํ˜„์žฌ ํ‰๊ฐ€ ์‹œ์Šคํ…œ์˜ ๋ฌธ์ œ์ :

  • ๋Œ€๋ถ€๋ถ„์˜ ๋ฒค์น˜๋งˆํฌ๊ฐ€ ํ‘œ์ค€ํ™”๋œ ์ธ๊ฐ„ ์‹œํ—˜ ๋ชจ๋ฐฉ: ์ •ํ™•๋„, ํ†ต๊ณผ์œจ ๋“ฑ ์ด์ง„ ์ง€ํ‘œ ์‚ฌ์šฉ
  • MMLU, GPQA, SWE-bench ๋“ฑ ์ฃผ์š” ๋ฒค์น˜๋งˆํฌ๋“ค์ด ๋ชจ๋‘ โ€œ๋งžํžˆ๊ธฐโ€ ๋ฐฉ์‹

Model A vs Model B ์‚ฌ๊ณ ์‹คํ—˜:

๊ตฌ์ฒด์  ์‹œ๋‚˜๋ฆฌ์˜ค:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
์งˆ๋ฌธ: "2023๋…„ ํ™”ํ•™ ๋…ธ๋ฒจ์ƒ ์ˆ˜์ƒ์ž๋Š”?"

Model A (์ •๋ ฌ๋œ ๋ชจ๋ธ):
- ํ™•์‹คํ•  ๋•Œ: "Moungi Bawendi, Louis Brus, Alexei Ekimov"
- ๋ถˆํ™•์‹คํ•  ๋•Œ: "์ •ํ™•ํžˆ ์•Œ์ง€ ๋ชปํ•ฉ๋‹ˆ๋‹ค"

Model B (์ถ”์ธก ๋ชจ๋ธ):
- ํ™•์‹คํ•  ๋•Œ: "Moungi Bawendi, Louis Brus, Alexei Ekimov" 
- ๋ถˆํ™•์‹คํ•  ๋•Œ๋„: "Carolyn Bertozzi" (2022๋…„ ์ˆ˜์ƒ์ž๋กœ ์ถ”์ธก)

๋ฒค์น˜๋งˆํฌ ๊ฒฐ๊ณผ:
- ์•Œ๊ณ  ์žˆ๋Š” ๋ฌธ์ œ: ๋‘˜ ๋‹ค ๋งž์Œ (๊ฐ๊ฐ 1์ )
- ๋ชจ๋ฅด๋Š” ๋ฌธ์ œ: A๋Š” 0์ , B๋Š” ๊ฐ€๋” ๋งž์ถฐ์„œ ์ ์ˆ˜ ํš๋“
โ†’ ์ด์ : B๊ฐ€ ๋” ๋†’์Œ!
  • Model A: ์ •๋ ฌ๋œ ๋ชจ๋ธ, ์˜ฌ๋ฐ”๋ฅธ ๋ถˆํ™•์‹ค์„ฑ ์‹ ํ˜ธ, ์ ˆ๋Œ€ ํ™˜๊ฐํ•˜์ง€ ์•Š์Œ
  • Model B: Model A์™€ ์œ ์‚ฌํ•˜๋‚˜ ๋ถˆํ™•์‹ค์„ฑ ํ‘œ์‹œ ์—†์ด ํ•ญ์ƒ โ€œ์ถ”์ธกโ€
  • ์—ญ์„ค์  ๊ฒฐ๊ณผ: 0-1 ์ฑ„์ ์—์„œ Model B๊ฐ€ Model A๋ณด๋‹ค ์šฐ์ˆ˜ํ•œ ์„ฑ๋Šฅ

โ€œ์ „์—ผ๋ณ‘(Epidemic)โ€ ๊ฐœ๋…

๋ฌธ์ œ์˜ ์••๋„์  ๊ทœ๋ชจ:
์ €์ž๋“ค์ด ์ฃผ์š” ๋ฒค์น˜๋งˆํฌ๋ฅผ ๋ถ„์„ํ•œ ๊ฒฐ๊ณผ, 10๊ฐœ ์ค‘ 9๊ฐœ๊ฐ€ ์ด๋Ÿฐ ์‹์œผ๋กœ ์ฑ„์ ํ•ฉ๋‹ˆ๋‹ค.

  • ๋ถˆํ™•์‹ค์„ฑ๊ณผ ๊ธฐ๊ถŒ์„ ์ฒ˜๋ฒŒํ•˜๋Š” ํ‰๊ฐ€๋“ค์˜ ์••๋„์  ๋‹ค์ˆ˜
  • 1๊ฐœ์˜ ์ข‹์€ ํ‰๊ฐ€ vs 9๊ฐœ์˜ ๋‚˜์œ ํ‰๊ฐ€ = ์—ฌ์ „ํžˆ ์ถ”์ธก์ด ์œ ๋ฆฌ

์™œ โ€œ์ „์—ผ๋ณ‘โ€์ธ๊ฐ€:

1
2
3
4
5
6
7
๋น„์œ : 
- 1๊ฐœ ๋ณ‘์›: "์ •์งํ•˜๊ฒŒ ๋ง์”€๋“œ๋ฆฌ๋ฉด ์ž˜ ๋ชจ๋ฅด๊ฒ ์Šต๋‹ˆ๋‹ค"
- 9๊ฐœ ๋ณ‘์›: "ํ™•์‹คํ•ฉ๋‹ˆ๋‹ค!" (ํ‹€๋ฆด ์ˆ˜๋„ ์žˆ์ง€๋งŒ)

ํ™˜์ž๋“ค์€ 9๊ฐœ ๋ณ‘์›์„ ๋” ์‹ ๋ขฐํ•˜๊ฒŒ ๋จ
โ†’ ์ •์งํ•œ 1๊ฐœ ๋ณ‘์›์ด ๊ฒฝ์Ÿ์—์„œ ๋ฐ€๋ฆผ
โ†’ ๋ชจ๋“  ๋ณ‘์›์ด ๊ณผ์‹ ํ•˜๋Š” ๋ฐฉํ–ฅ์œผ๋กœ ์ง„ํ™”

๊ธฐ์กด ํ•ด๊ฒฐ์ฑ…์˜ ํ•œ๊ณ„:

  • ์†Œ์ˆ˜์˜ ํ™˜๊ฐ ํ‰๊ฐ€๋กœ๋Š” ์ด๋Ÿฌํ•œ ๊ตฌ์กฐ์  ๋ถˆ๊ท ํ˜• ํ•ด๊ฒฐ ๋ถˆ๊ฐ€๋Šฅ
  • ์ƒˆ๋กœ์šด ํ™˜๊ฐ ํ‰๊ฐ€๋ฅผ 100๊ฐœ ๋งŒ๋“ค์–ด๋„, ๊ธฐ์กด ์ฃผ๋ฅ˜ ํ‰๊ฐ€๋“ค์ด ๋ฐ”๋€Œ์ง€ ์•Š์œผ๋ฉด ์˜๋ฏธ ์—†์Œ

๊ทผ๋ณธ์  ํ•ด๊ฒฐ์ฑ…์˜ ํ•„์š”์„ฑ:

  • ์ฃผ์š” ํ‰๊ฐ€๋“ค ์ž์ฒด์˜ ์ˆ˜์ • ํ•„์š”์„ฑ
  • ๊ฐœ๋ณ„ ํ™˜๊ฐ ํ‰๊ฐ€ ์ถ”๊ฐ€๊ฐ€ ์•„๋‹Œ, ๊ธฐ์กด ์‹œ์Šคํ…œ์˜ ๊ตฌ์กฐ์  ๋ณ€๊ฒฝ์ด ํ•„์š”
  • โ€œ์™„๋ฒฝํ•œ ํ™˜๊ฐ ํ‰๊ฐ€โ€๋ฅผ ์ฐพ๋Š” ๊ฒƒ์ด ์•„๋‹ˆ๋ผ, ์ฃผ๋ฅ˜ ํ‰๊ฐ€๋“ค์ด ํ™˜๊ฐ์„ ๋ถ€์ถ”๊ธฐ์ง€ ์•Š๋„๋ก ํ•˜๋Š” ๊ฒƒ์ด ํ•ต์‹ฌ

๐Ÿ“– Chapter 2: Related Work - ๊ธฐ์กด ์—ฐ๊ตฌ์™€์˜ ์ฐจ๋ณ„ํ™”

์ฑ•ํ„ฐ์˜ ํ•ต์‹ฌ ๊ธฐ์—ฌ

  1. ๋ณธ ์—ฐ๊ตฌ์˜ ์ด๋ก ์  ๋…์ฐฝ์„ฑ์„ ๊ธฐ์กด ์—ฐ๊ตฌ์™€์˜ ๋ช…ํ™•ํ•œ ๋น„๊ต๋ฅผ ํ†ตํ•ด ์ž…์ฆ
  2. ํ™˜๊ฐ ์—ฐ๊ตฌ ๋ถ„์•ผ์˜ ๋ณต์žก์„ฑ๊ณผ ๋‹ค๋ฉด์  ํŠน์„ฑ์„ ์ฒด๊ณ„์ ์œผ๋กœ ์ •๋ฆฌ
  3. ๊ธฐ์กด ํ•ด๊ฒฐ์ฑ…๋“ค์˜ ํ•œ๊ณ„๋ฅผ ๋ถ„์„ํ•˜์—ฌ ์ƒˆ๋กœ์šด ์ ‘๊ทผ๋ฒ•์˜ ํ•„์š”์„ฑ ๋ถ€๊ฐ
  4. ํ›„ํ›ˆ๋ จ ๊ธฐ๋ฒ•๋“ค์˜ ๋ถ€๋ถ„์  ์„ฑ๊ณต๊ณผ ๊ทผ๋ณธ์  ํ•œ๊ณ„๋ฅผ ๊ท ํ˜•์žˆ๊ฒŒ ํ‰๊ฐ€

์ด ์žฅ์€ ๋ณธ ์—ฐ๊ตฌ์˜ ๋…์ฐฝ์„ฑ์„ ๊ธฐ์กด ์—ฐ๊ตฌ๋“ค๊ณผ์˜ ์ฒด๊ณ„์  ๋น„๊ต๋ฅผ ํ†ตํ•ด ๋ถ€๊ฐ์‹œํ‚ค๊ณ , ํ™˜๊ฐ ์—ฐ๊ตฌ ๋ถ„์•ผ์˜ ๋ณต์žก์„ฑ๊ณผ ๋‹ค๋ฉด์  ํŠน์„ฑ์„ ์ข…ํ•ฉ์ ์œผ๋กœ ์ •๋ฆฌํ•ฉ๋‹ˆ๋‹ค.
ํŠนํžˆ ๋ณธ ์—ฐ๊ตฌ๊ฐ€ ์ œ์‹œํ•˜๋Š” IIV ํ™˜์›์˜ ์ƒˆ๋กœ์›€๊ณผ ์‚ฌํšŒ๊ธฐ์ˆ ์  ์ ‘๊ทผ๋ฒ•์˜ ์ฐจ๋ณ„์„ฑ์„ ๋ช…ํ™•ํžˆ ๋“œ๋Ÿฌ๋ƒ…๋‹ˆ๋‹ค.

1. ํ™˜์› ๋ฐฉ๋ฒ•๋ก ์˜ ์ด๋ก ์  ๋…์ฐฝ์„ฑ

์ƒˆ๋กœ์šด ํ™˜์›์˜ ์˜์˜:

  • ์ง€๋„ํ•™์Šต โ†’ ๋น„์ง€๋„ํ•™์Šต ํ™˜์›: ์ด์ง„ ๋ถ„๋ฅ˜(์ง€๋„)์—์„œ ๋ฐ€๋„ ์ถ”์ •(๋น„์ง€๋„)์œผ๋กœ์˜ ํ™˜์›์ด ๋ณธ ์—ฐ๊ตฌ์˜ ํ•ต์‹ฌ ๊ธฐ์—ฌ
  • ๊ธฐ์กด ํ™˜์› ๊ธฐ๋ฒ•๊ณผ์˜ ์ฐจ๋ณ„์„ฑ: ํ•™์Šต ๋ฌธ์ œ ๊ฐ„ ํ™˜์› ์ž์ฒด๋Š” ํ™•๋ฆฝ๋œ ๋ฐฉ๋ฒ•๋ก ์ด์ง€๋งŒ, ํŠน์ • ํ™˜์› ๋ฐฉํ–ฅ์€ ์ฐธ์‹ 
  • Beygelzimer et al. (2016) ์ฐธ์กฐ: ํ•œ ๋ฌธ์ œ๊ฐ€ ๋‹ค๋ฅธ ๋ฌธ์ œ๋ณด๋‹ค โ€œ์ตœ์†Œํ•œ ์–ด๋ ค์›€โ€์„ ๋ณด์ด๋Š” ์ „ํ†ต์  ๋ฐฉ๋ฒ•๋ก ์˜ ์ƒˆ๋กœ์šด ์‘์šฉ

ํ™˜์›์˜ ์‹ค์šฉ์  ๊ฐ€์น˜:

  • ์ˆ˜์‹ญ ๋…„๊ฐ„ ์ถ•์ ๋œ ์ด์ง„ ๋ถ„๋ฅ˜ ์˜ค๋ฅ˜ ์ด๋ก ์„ ํ™˜๊ฐ ๋ถ„์„์— ์ง์ ‘ ํ™œ์šฉ ๊ฐ€๋Šฅ
  • Domingos (2012)๊ฐ€ ์ •๋ฆฌํ•œ ๊ธฐ๊ณ„ํ•™์Šต ์˜ค๋ฅ˜์˜ ๋‹ค๋ฉด์  ํŠน์„ฑ์„ ํ™˜๊ฐ์— ์ ์šฉ

2. ํ™˜๊ฐ ์›์ธ ์—ฐ๊ตฌ์˜ ๊ธฐ์กด ์„ฑ๊ณผ๋“ค

Sun et al. (2025)์˜ ์ข…ํ•ฉ์  ์š”์ธ ๋ถ„๋ฅ˜:

๋ชจ๋ธ ์ž์ฒด์˜ ๊ตฌ์กฐ์  ๋ฌธ์ œ:

  • ๋ชจ๋ธ ๊ณผ์‹ (Model overconfidence) - Yin et al. (2023): ๋ถ€์ •ํ™•ํ•œ ์‹ ๋ขฐ๋„ ์ถ”์ •
  • ๋””์ฝ”๋”ฉ ๋ฌด์ž‘์œ„์„ฑ(Decoding randomness) - Lee et al. (2022): ์ƒ์„ฑ ๊ณผ์ •์˜ ํ™•๋ฅ ์  ํŠน์„ฑ
  • ๋…ธ์ถœ ํŽธํ–ฅ(Exposure bias) - Bengio et al. (2015): ํ›ˆ๋ จ๊ณผ ์ถ”๋ก  ์‹œ ์ž…๋ ฅ ๋ถ„ํฌ ๋ถˆ์ผ์น˜

๋ฐ์ดํ„ฐ์™€ ํ›ˆ๋ จ ๊ณผ์ •์˜ ๋ฌธ์ œ:

  • ๊ธด ๊ผฌ๋ฆฌ ํ›ˆ๋ จ ์ƒ˜ํ”Œ(Long-tailed training samples) - Sun et al. (2023): ๋“œ๋ฌผ๊ฒŒ ๋‚˜ํƒ€๋‚˜๋Š” ์‚ฌ์‹ค๋“ค์˜ ํ•™์Šต ์–ด๋ ค์›€
  • ์˜ค๋„ํ•˜๋Š” ์ •๋ ฌ ํ›ˆ๋ จ(Misleading alignment training) - Wei et al. (2023): ๋ถ€์ ์ ˆํ•œ ํ›„ํ›ˆ๋ จ ๋ชฉํ‘œ
  • ํ—ˆ์œ„ ์ƒ๊ด€๊ด€๊ณ„(Spurious correlations) - Li et al. (2022): ์šฐ์—ฐํ•œ ํŒจํ„ด์— ๋Œ€ํ•œ ๊ณผ๋„ํ•œ ์˜์กด

์‹œํ€€์Šค์™€ ๋งฅ๋ฝ์˜ ๋ฌธ์ œ:

  • ๋ˆˆ๋ฉ์ด ํšจ๊ณผ(Snowballing effects) - Zhang et al. (2023): ์ดˆ๊ธฐ ์˜ค๋ฅ˜๊ฐ€ ํ›„์† ์ƒ์„ฑ์— ๋ฏธ์น˜๋Š” ๋ˆ„์  ์˜ํ–ฅ
  • ์—ญ์ „ ์ €์ฃผ(Reversal curse) - Berglund et al. (2024): โ€œA๋Š” B์ด๋‹คโ€๋กœ ํ›ˆ๋ จ๋œ ๋ชจ๋ธ์ด โ€œB๋Š” A์ด๋‹คโ€๋ฅผ ํ•™์Šตํ•˜์ง€ ๋ชปํ•˜๋Š” ํ˜„์ƒ
  • ๋งฅ๋ฝ ํ•˜์ด์žฌํ‚น(Context hijacking) - Jeong (2024): ์•…์˜์  ๋˜๋Š” ์˜ค๋„ํ•˜๋Š” ๋งฅ๋ฝ์— ์˜ํ•œ ์‘๋‹ต ์กฐ์ž‘

3. ๊ฐ€์žฅ ๋ฐ€์ ‘ํ•œ ์ด๋ก ์  ์—ฐ๊ตฌ์™€์˜ ๊ด€๊ณ„

Kalai and Vempala (2024)์™€์˜ ๋น„๊ต:

๊ณตํ†ต์ ๊ณผ ๊ธฐ์—ฌ:

  • Good-Turing ์ถ”์ •๊ธฐ ์—ฐ๊ฒฐ: Alan Turing์˜ ์šฐ์•„ํ•œ โ€œ๋ˆ„๋ฝ ์งˆ๋Ÿ‰โ€ ์ถ”์ •์„ ํ™˜๊ฐ์— ์ ์šฉ
  • Theorem 3์˜ ์˜๊ฐ ์ œ๊ณต: ๋ณธ ์—ฐ๊ตฌ์˜ ํ•ต์‹ฌ ์ •๋ฆฌ ์ค‘ ํ•˜๋‚˜์˜ ์ด๋ก ์  ํ† ๋Œ€

๋ณธ ์—ฐ๊ตฌ์˜ ํ™•์žฅ๋œ ๊ธฐ์—ฌ:

  1. ๋ถˆํ™•์‹ค์„ฑ ํ‘œํ˜„ ํฌํ•จ: IDK์™€ ๊ฐ™์€ ๋ช…์‹œ์  ๋ถˆํ™•์‹ค์„ฑ ์‘๋‹ต ๊ณ ๋ ค
  2. ์ง€๋„ํ•™์Šต ์—ฐ๊ฒฐ: ์ด์ง„ ๋ถ„๋ฅ˜์™€์˜ ์ˆ˜ํ•™์  ๊ด€๊ณ„ ์ˆ˜๋ฆฝ
  3. ํ›„ํ›ˆ๋ จ ์ˆ˜์ • ๋ถ„์„: ์‚ฌ์ „ํ›ˆ๋ จ ์ดํ›„ ๋‹จ๊ณ„์˜ ์ฒด๊ณ„์  ๋ถ„์„
  4. ํ”„๋กฌํ”„ํŠธ ๋ชจ๋ธ ํฌํ•จ: ๋งฅ๋ฝ-์‘๋‹ต ์Œ์„ ํฌํ•จํ•œ ๋” ํ˜„์‹ค์  ๋ชจ๋ธ๋ง
  5. ์‚ฌํšŒ๊ธฐ์ˆ ์  ํ•ด๊ฒฐ์ฑ…: ํ‰๊ฐ€ ๋ฐฉ์‹ ์ˆ˜์ •์„ ํ†ตํ•œ ์‹ค์šฉ์  ์ ‘๊ทผ

๋‹ค๋ฅธ ์ด๋ก ์  ์—ฐ๊ตฌ๋“ค:

Hanneke et al. (2018):

  • ์œ ํšจ์„ฑ ์˜ค๋ผํด ์ฟผ๋ฆฌ: ์ธ๊ฐ„ ๊ฒ€์ฆ์ž๋ฅผ ํ™œ์šฉํ•œ ๋Œ€ํ™”ํ˜• ํ•™์Šต ์•Œ๊ณ ๋ฆฌ์ฆ˜
  • ํ†ต๊ณ„์  ํšจ์œจ์„ฑ: ํ•ฉ๋ฆฌ์ ์ธ ๋ฐ์ดํ„ฐ ์–‘์œผ๋กœ ํ™˜๊ฐ ์ตœ์†Œํ™”
  • ๊ณ„์‚ฐ์  ๋น„ํšจ์œจ์„ฑ: ์‹ค์šฉ์  ๊ตฌํ˜„์˜ ์–ด๋ ค์›€

์ตœ๊ทผ ์ด๋ก  ์—ฐ๊ตฌ๋“ค์˜ ํ•ต์‹ฌ ํ†ต์ฐฐ:

  • Kalavasis et al. (2025): ์ผ๊ด€์„ฑ(๋ฌดํšจ ์ถœ๋ ฅ ๋ฐฉ์ง€)๊ณผ ํญ(๋‹ค์–‘ํ•˜๊ณ  ์–ธ์–ด์ ์œผ๋กœ ํ’๋ถ€ํ•œ ์ฝ˜ํ…์ธ  ์ƒ์„ฑ) ๊ฐ„์˜ ๋ณธ์งˆ์  ํŠธ๋ ˆ์ด๋“œ์˜คํ”„
  • Kleinberg and Mullainathan (2024): ๊ด‘๋ฒ”์œ„ํ•œ ์–ธ์–ด ํด๋ž˜์Šค์— ๋Œ€ํ•ด ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ๋ฅผ ๋„˜์–ด ์ผ๋ฐ˜ํ™”ํ•˜๋Š” ๋ชจ๋ธ์€ ํ™˜๊ฐํ•˜๊ฑฐ๋‚˜ ๋ชจ๋“œ ๋ถ•๊ดด๋ฅผ ๊ฒช์„ ์ˆ˜๋ฐ–์— ์—†์Œ์„ ์ฆ๋ช…

4. ํ›„ํ›ˆ๋ จ ๊ธฐ๋ฒ•๋“ค์˜ ์„ฑ๊ณผ์™€ ํ•œ๊ณ„

ํšจ๊ณผ๊ฐ€ ์ž…์ฆ๋œ ๊ธฐ๋ฒ•๋“ค:

์ธ๊ฐ„ ํ”ผ๋“œ๋ฐฑ ๊ธฐ๋ฐ˜ ๊ฐ•ํ™”ํ•™์Šต ๊ณ„์—ด:

  • RLHF (Reinforcement Learning from Human Feedback) - Ouyang et al. (2022): ์ธ๊ฐ„ ์„ ํ˜ธ๋„๋ฅผ ํ†ตํ•œ ๋ชจ๋ธ ์ •๋ ฌ
  • RLAIF (Reinforcement Learning from AI Feedback) - Bai et al. (2022): AI๊ฐ€ ์ƒ์„ฑํ•œ ํ”ผ๋“œ๋ฐฑ ํ™œ์šฉ
  • DPO (Direct Preference Optimization) - Rafailov et al. (2023): ๊ฐ•ํ™”ํ•™์Šต ์—†์ด ์ง์ ‘ ์„ ํ˜ธ๋„ ์ตœ์ ํ™”

ํŠน์ • ์œ ํ˜• ํ™˜๊ฐ์— ๋Œ€ํ•œ ์„ฑ๊ณผ:

  • ์Œ๋ชจ๋ก ๊ณผ ์ผ๋ฐ˜์  ์˜คํ•ด์— ๋Œ€ํ•œ ํ™˜๊ฐ ๊ฐ์†Œ ํšจ๊ณผ ์ž…์ฆ
  • ํ•˜์ง€๋งŒ ๋ชจ๋“  ์œ ํ˜•์˜ ํ™˜๊ฐ์„ ์™„์ „ํžˆ ์ œ๊ฑฐํ•˜์ง€๋Š” ๋ชปํ•จ

๋ฏธ์„ธ์กฐ์ •์˜ ์—ญ์„ค์  ๊ฒฐ๊ณผ:

  • Gekhman et al. (2024)์˜ ๋ฐœ๊ฒฌ: ์ƒˆ๋กœ์šด ์ •๋ณด์— ๋Œ€ํ•œ ๋‹จ์ˆœ ๋ฏธ์„ธ์กฐ์ •์ด ์ดˆ๊ธฐ์—๋Š” ํ™˜๊ฐ๋ฅ ์„ ๊ฐ์†Œ์‹œํ‚ค์ง€๋งŒ, ์‹œ๊ฐ„์ด ์ง€๋‚˜๋ฉด ๋‹ค์‹œ ์ฆ๊ฐ€
  • ์ด๋Š” ๊ทผ๋ณธ์  ํ•ด๊ฒฐ์ฑ…์ด ์•„๋‹Œ ์ž„์‹œ๋ฐฉํŽธ์ผ ์ˆ˜ ์žˆ์Œ์„ ์‹œ์‚ฌ

์˜ˆ์ธก ์‹ ํ˜ธ ์—ฐ๊ตฌ:

  • ์ž์—ฐ์–ด ์ฟผ๋ฆฌ์™€ ๋‚ด๋ถ€ ๋ชจ๋ธ ํ™œ์„ฑํ™”: ์‚ฌ์‹ค์  ์ •ํ™•์„ฑ๊ณผ ๋ชจ๋ธ ๋ถˆํ™•์‹ค์„ฑ์— ๋Œ€ํ•œ ์˜ˆ์ธก ์‹ ํ˜ธ ์ธ์ฝ”๋”ฉ (Kadavath et al., 2022)
  • ์˜๋ฏธ๋ก ์ ์œผ๋กœ ๊ด€๋ จ๋œ ์ฟผ๋ฆฌ ๊ฐ„ ๋ถˆ์ผ์น˜: ํ™˜๊ฐ ํƒ์ง€๋‚˜ ์™„ํ™”์— ํ™œ์šฉ ๊ฐ€๋Šฅ (Manakul et al., 2023; Xue et al., 2025; Agrawal et al., 2024)

5. ๊ธฐ์กด ์—ฐ๊ตฌ๋“ค์˜ ํ•œ๊ณ„์™€ ๋ณธ ์—ฐ๊ตฌ์˜ ์ฐจ๋ณ„์„ฑ

ํฌ๊ด„์  ํ•ด๊ฒฐ์ฑ…๋“ค์˜ ํ˜„ํ™ฉ:

  • Ji et al. (2023), Tian et al. (2024)์˜ ์„œ๋ฒ ์ด: ๋‹ค์–‘ํ•œ ํ™˜๊ฐ ์™„ํ™” ๋ฐฉ๋ฒ•๋“ค์ด ๊ฐœ๋ฐœ๋˜์—ˆ์ง€๋งŒ ์ฑ„ํƒ์— ์žฅ๋ฒฝ ์กด์žฌ
  • 2025 AI Index ๋ณด๊ณ ์„œ (Maslej et al., 2025): ํ™˜๊ฐ ๋ฒค์น˜๋งˆํฌ๋“ค์ด โ€œAI ์ปค๋ฎค๋‹ˆํ‹ฐ ๋‚ด์—์„œ ๊ฒฌ์ธ๋ ฅ์„ ์–ป๋Š” ๋ฐ ์–ด๋ ค์›€์„ ๊ฒช๊ณ  ์žˆ์Œโ€

ํ‰๊ฐ€์™€ ๋ฒค์น˜๋งˆํฌ์˜ ํ•œ๊ณ„:

  • Bang et al. (2025), Hong et al. (2024): ํฌ๊ด„์  ๋ฒค์น˜๋งˆํฌ์™€ ๋ฆฌ๋”๋ณด๋“œ๊ฐ€ ๋„์ž…๋˜์—ˆ์ง€๋งŒ ์ฑ„ํƒ ์žฅ๋ฒฝ์— ๋Œ€ํ•œ ๋ถ„์„ ๋ถ€์กฑ
  • ๋ณธ ์—ฐ๊ตฌ๊ฐ€ ์ด๋Ÿฌํ•œ ์žฅ๋ฒฝ์˜ ๊ทผ๋ณธ ์›์ธ์„ ์‚ฌํšŒ๊ธฐ์ˆ ์  ๊ด€์ ์—์„œ ๋ถ„์„

๋ถˆํ™•์‹ค์„ฑ ํ‘œํ˜„ ์—ฐ๊ตฌ:

  • ์ด์ง„ ํ™•์‹ค์„ฑ์„ ๋„˜์–ด์„  ์ ‘๊ทผ: Mielke et al. (2022), Lin et al. (2022a), Damani et al. (2025)์˜ ์ ์ง„์  ๋ถˆํ™•์‹ค์„ฑ ํ‘œํ˜„ ์—ฐ๊ตฌ
  • ํ™”์šฉ๋ก (Pragmatics) ์—ฐ๊ตฌ: Ma et al. (2025)์˜ ๋งฅ๋ฝ์ด ์˜๋ฏธ๋ฅผ ํ˜•์„ฑํ•˜๋Š” ๋ฐฉ์‹ ์—ฐ๊ตฌ - ์–ธ์–ด ๋ชจ๋ธ์˜ ์ •๋ณด ์ „๋‹ฌ ๊ฐœ์„ ์— ๋Œ€ํ•œ ๊ด€๋ จ์„ฑ ์ฆ๊ฐ€

๐Ÿ“– Chapter 3: Pretraining Errors - ์‚ฌ์ „ํ›ˆ๋ จ์—์„œ์˜ ์˜ค๋ฅ˜ ๋ฐœ์ƒ ๋ฉ”์ปค๋‹ˆ์ฆ˜

์ฑ•ํ„ฐ์˜ ํ•ต์‹ฌ ๊ธฐ์—ฌ

  1. IIV ํ™˜์›์˜ ์ˆ˜ํ•™์  ์—„๋ฐ€์„ฑ: ํ™˜๊ฐ์„ ์ด์ง„ ๋ถ„๋ฅ˜ ๋ฌธ์ œ๋กœ ํ™˜์›ํ•˜๋Š” ์™„์ „ํ•œ ์ด๋ก ์  ํ”„๋ ˆ์ž„์›Œํฌ ์ œ์‹œ
  2. ๋‹ค์ธต์  ์˜ค๋ฅ˜ ๋ถ„์„: ์ž„์˜์  ์‚ฌ์‹ค, ๋ถˆ๋Ÿ‰ ๋ชจ๋ธ, ๊ณ„์‚ฐ์  ์–ด๋ ค์›€ ๋“ฑ ๋‹ค์–‘ํ•œ ์›์ธ์˜ ์ฒด๊ณ„์  ๋ถ„๋ฅ˜
  3. ์ •๋Ÿ‰์  ์˜ˆ์ธก: ์‹ฑ๊ธ€ํ†ค ๋น„์œจ๊ณผ ํ™˜๊ฐ๋ฅ  ์‚ฌ์ด์˜ ๊ตฌ์ฒด์  ์ˆ˜ํ•™์  ๊ด€๊ณ„ ๊ทœ๋ช…
  4. ์ผ๋ฐ˜์„ฑ๊ณผ ๊ตฌ์ฒด์„ฑ์˜ ๊ท ํ˜•: ์ผ๋ฐ˜์  ์ด๋ก ๊ณผ ๊ตฌ์ฒด์  ์˜ˆ์‹œ(์‚ผ์ค‘ํ•ญ ๋ชจ๋ธ, ๋ฌธ์ž ์„ธ๊ธฐ)์˜ ์กฐํ™”

์ด ์žฅ์€ ๋ณธ ๋…ผ๋ฌธ์˜ ๊ฐ€์žฅ ์ค‘์š”ํ•œ ์ด๋ก ์  ๊ธฐ์—ฌ์ธ IIV ํ™˜์› ๋ฐฉ๋ฒ•์„ ์ˆ˜ํ•™์ ์œผ๋กœ ์—„๋ฐ€ํ•˜๊ฒŒ ์ œ์‹œํ•˜๊ณ , ์‚ฌ์ „ํ›ˆ๋ จ ๋‹จ๊ณ„์—์„œ ํ™˜๊ฐ์ด ๋ฐœ์ƒํ•˜๋Š” ๊ทผ๋ณธ์  ๋ฉ”์ปค๋‹ˆ์ฆ˜์„ ๋‹ค๊ฐ๋„๋กœ ๋ถ„์„ํ•ฉ๋‹ˆ๋‹ค. ๋‹จ์ˆœํ•œ ์ž๋™์™„์„ฑ ๊ด€์ ์„ ๋„˜์–ด์„œ ์ผ๋ฐ˜์ ์ธ ๋ฐ€๋„ ์ถ”์ • ๋ฌธ์ œ๋กœ ์ ‘๊ทผํ•˜์—ฌ ํ™˜๊ฐ์˜ ํ†ต๊ณ„์  ํ•„์—ฐ์„ฑ์„ ์ฆ๋ช…ํ•ฉ๋‹ˆ๋‹ค.

3.1 ํ”„๋กฌํ”„ํŠธ๊ฐ€ ์—†๋Š” ํ™˜์› - ๊ธฐ๋ณธ ์ด๋ก  ๊ตฌ์ถ•

๊ธฐ๋ณธ ์„ค์ •์˜ ์ˆ˜ํ•™์  ์ •์˜:

ํ™•๋ฅ  ๋ถ„ํฌ๋กœ์„œ์˜ ๊ธฐ๋ณธ ๋ชจ๋ธ:

  • ๊ธฐ๋ณธ ๋ชจ๋ธ pฬ‚: ์ง‘ํ•ฉ X์— ๋Œ€ํ•œ ํ™•๋ฅ  ๋ถ„ํฌ
  • ์ „์ฒด ์ง‘ํ•ฉ ๋ถ„ํ• : X = E โˆช V (์˜ค๋ฅ˜ ์ง‘ํ•ฉ๊ณผ ์œ ํšจ ์ง‘ํ•ฉ์˜ ์„œ๋กœ์†Œ ํ•ฉ์ง‘ํ•ฉ)
  • ์˜ค๋ฅ˜์œจ ์ •์˜:
    err:=p^(E)=Prโกxโˆผp^[xโˆˆE]\text{err} := \hat{p}(E) = \Pr_{x \sim \hat{p}}[x \in E]err:=p^โ€‹(E)=Prxโˆผp^โ€‹โ€‹[xโˆˆE]
  • ๋ฌด์žก์Œ ํ›ˆ๋ จ ๊ฐ€์ •: ํ›ˆ๋ จ ๋ถ„ํฌ p์— ๋Œ€ํ•ด p(E) = 0 (๋ชจ๋“  ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ๋Š” ์œ ํšจํ•จ)

IIV ์ด์ง„ ๋ถ„๋ฅ˜ ๋ฌธ์ œ์˜ ํ˜•์‹์  ๊ตฌ์„ฑ:

๋ชฉํ‘œ ํ•จ์ˆ˜ ์ •์˜:

f:Xโ†’{โˆ’,+},f(x):={+ifย xโˆˆVโˆ’ifย xโˆˆEf : X \rightarrow {-, +}, \quad f(x) := \begin{cases} + & \text{if } x \in V \ - & \text{if } x \in E \end{cases}f:Xโ†’{โˆ’,+},f(x):={+โˆ’โ€‹ifย xโˆˆVifย xโˆˆEโ€‹

ํ›ˆ๋ จ ๋ถ„ํฌ ์„ค๊ณ„:

D(x):={p(x)/2ifย xโˆˆV1/(2โˆฃEโˆฃ)ifย xโˆˆED(x) := \begin{cases} p(x)/2 & \text{if } x \in V \ 1/(2 E ) & \text{if } x \in E \end{cases}D(x):={p(x)/21/(2โˆฃEโˆฃ)โ€‹ifย xโˆˆVifย xโˆˆEโ€‹

์ด ๋ถ„ํฌ๋Š” ์œ ํšจํ•œ ์˜ˆ์ œ(ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ์—์„œ ์ถ”์ถœ)์™€ ๊ท ๋“ฑํ•˜๊ฒŒ ๋ฌด์ž‘์œ„๋กœ ์„ ํƒ๋œ ์˜ค๋ฅ˜์˜ 50/50 ํ˜ผํ•ฉ์ž…๋‹ˆ๋‹ค.

๋ถ„๋ฅ˜๊ธฐ ๊ตฌ์„ฑ๊ณผ ์ž„๊ณ„๊ฐ’ ์„ค์ •:

f^(x):={+ifย p^(x)>1/โˆฃEโˆฃโˆ’ifย p^(x)โ‰ค1/โˆฃEโˆฃ\hat{f}(x) := \begin{cases} + & \text{if } \hat{p}(x) > 1/ E \ - & \text{if } \hat{p}(x) \leq 1/ E \end{cases}f^โ€‹(x):={+โˆ’โ€‹ifย p^โ€‹(x)>1/โˆฃEโˆฃifย p^โ€‹(x)โ‰ค1/โˆฃEโˆฃโ€‹

ํ•ต์‹ฌ ๊ฒฐ๊ณผ - Corollary 1:
์ž„์˜์˜ ํ›ˆ๋ จ ๋ถ„ํฌ p(V) = 1๊ณผ ์ž„์˜์˜ ๊ธฐ๋ณธ ๋ชจ๋ธ pฬ‚์— ๋Œ€ํ•ด:
errโ‰ฅ2โ‹…erriivโˆ’โˆฃVโˆฃโˆฃEโˆฃโˆ’ฮด\text{err} \geq 2 \cdot \text{err}_{iiv} - \frac{|V|}{|E|} - \deltaerrโ‰ฅ2โ‹…erriivโ€‹โˆ’โˆฃEโˆฃโˆฃVโˆฃโ€‹โˆ’ฮด

์—ฌ๊ธฐ์„œ:

  • err: ์ƒ์„ฑ ์˜ค๋ฅ˜์œจ
  • err_iiv: IIV ์˜ค๋ถ„๋ฅ˜์œจ
  • ฮด: ๋ณด์ • ์˜ค์ฐจ = pฬ‚(A) - p(A) for A := {x โˆˆ X pฬ‚(x) > 1/ E }

๋ถ€๋“ฑ์‹์˜ ์‹ค์šฉ์  ์˜๋ฏธ:

  • ์ƒ์ˆ˜ 2๋Š” ์ƒ๋Œ€์ ์œผ๋กœ tightํ•œ bound (ํฐ E ์™€ ์ž‘์€ ฮด์— ๋Œ€ํ•ด err_iiv๋Š” 1/2์— ๊ฐ€๊นŒ์šธ ์ˆ˜ ์žˆ๊ณ  err โ‰ค 1)
  • ํ•™์Šต ๋ถˆ๊ฐ€๋Šฅํ•œ ๊ฐœ๋…๋“ค์— ๋Œ€ํ•ด์„œ๋Š” err_iiv๊ฐ€ ํ•„์—ฐ์ ์œผ๋กœ ํฌ๊ณ , ๋”ฐ๋ผ์„œ ๋ชจ๋“  ๊ธฐ๋ณธ ๋ชจ๋ธ์ด ์˜ค๋ฅ˜๋ฅผ ๋ฒ”ํ•  ๊ฒƒ

ํ™˜๊ฐ ์˜ค๋ฅ˜๋กœ์˜ ์ ์šฉ:

  • ํ™˜๊ฐ์˜ ์ •์˜: E๋ฅผ ํ•˜๋‚˜ ์ด์ƒ์˜ ๊ทธ๋Ÿด๋“ฏํ•œ ๊ฑฐ์ง“์„ ํฌํ•จํ•˜๋Š” ์ƒ์„ฑ์˜ ์ง‘ํ•ฉ์œผ๋กœ ์„ค์ •
  • ์ ‘์ง€๋˜์ง€ ์•Š์€ ์ƒ์„ฑ: ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ์— ์ ‘์ง€๋˜์ง€ ์•Š์€ ์ƒ์„ฑ๋„ ํฌํ•จ (p(V) = 1 ๊ฐ€์ • ํ•˜์—์„œ ์‚ฌ์‹ค์  ์˜ค๋ฅ˜๋Š” ์‚ฌ์‹ค์ ์œผ๋กœ ์ •ํ™•ํ•œ ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ์— ์ ‘์ง€๋  ์ˆ˜ ์—†์Œ)

๋ณด์ •(Calibration) ๋ถ„์„์˜ ์‹ฌ์ธต ๊ณ ์ฐฐ

๋ณด์ • ์˜ค์ฐจ ฮด์˜ ํ•ด์„:

  • ์–ธ์–ด ์ง€์‹ ๋ถˆ์š”: ๊ท ๋“ฑ ๋ถ„ํฌ pฬ‚(x) = 1/ X ๋กœ๋„ ฮด = 0 ๋‹ฌ์„ฑ ๊ฐ€๋Šฅ
  • ๊ฐ์‚ฌ ๊ฐ€๋Šฅ์„ฑ: ํ›ˆ๋ จ ์ƒ˜ํ”Œ x ~ p์™€ ์ƒ์„ฑ ์ƒ˜ํ”Œ xฬ‚ ~ pฬ‚์„ ์‚ฌ์šฉํ•˜์—ฌ ฮด ์ถ”์ • ๊ฐ€๋Šฅ
  • ๋‚ ์”จ ์˜ˆ๋ณด ์œ ์ถ”: Dawid (1982)์˜ ๋ณด์ • ๊ฐœ๋… - ์˜ˆ์ธก ํ™•๋ฅ ๊ณผ ์‹ค์ œ ๋ฐœ์ƒ๋ฅ ์˜ ์ผ์น˜

๊ต์ฐจ ์—”ํŠธ๋กœํ”ผ ๋ชฉ์ ํ•จ์ˆ˜์™€์˜ ๊ด€๊ณ„:
ํ‘œ์ค€ ์‚ฌ์ „ํ›ˆ๋ จ ๋ชฉ์ ํ•จ์ˆ˜:
L(p^)=Exโˆผp[โˆ’logโกp^(x)]L(\hat{p}) = E_{x \sim p}[-\log \hat{p}(x)]L(p^โ€‹)=Exโˆผpโ€‹[โˆ’logp^โ€‹(x)]

์Šค์ผ€์ผ๋ง์„ ํ†ตํ•œ ๋ณด์ • ๋ถ„์„:
ํ™•๋ฅ ์„ ์ธ์ˆ˜ s > 0์œผ๋กœ ์žฌ์กฐ์ •:

p^s(x)โˆ{sโ‹…p^(x)ifย p^(x)>1/โˆฃEโˆฃp^(x)ifย p^(x)โ‰ค1/โˆฃEโˆฃ\hat{p}_s(x) \propto \begin{cases} s \cdot \hat{p}(x) & \text{if } \hat{p}(x) > 1/ E \ \hat{p}(x) & \text{if } \hat{p}(x) \leq 1/ E \end{cases}p^โ€‹sโ€‹(x)โˆ{sโ‹…p^โ€‹(x)p^โ€‹(x)โ€‹ifย p^โ€‹(x)>1/โˆฃEโˆฃifย p^โ€‹(x)โ‰ค1/โˆฃEโˆฃโ€‹

ํ•ต์‹ฌ ํ†ต์ฐฐ:
ฮด=โˆฃddsL(p^s)โˆฃs=1โˆฃ\delta = \left|\frac{d}{ds}L(\hat{p}_s)\bigg|_{s=1}\right|ฮด=โˆฃโˆฃโˆฃโˆฃโˆฃโ€‹dsdโ€‹L(p^โ€‹sโ€‹)โˆฃโˆฃโˆฃโˆฃโˆฃโ€‹s=1โ€‹โˆฃโˆฃโˆฃโˆฃโˆฃโ€‹

ฮด โ‰  0์ด๋ฉด s โ‰  1๋กœ ์žฌ์กฐ์ •ํ•˜์—ฌ ์†์‹ค์„ ์ค„์ผ ์ˆ˜ ์žˆ์œผ๋ฏ€๋กœ, ์ง€์—ญ ์ตœ์†Ÿ๊ฐ’์ด ์•„๋‹™๋‹ˆ๋‹ค. ๋”ฐ๋ผ์„œ ์ง€์—ญ ์ตœ์ ํ™”๋Š” ์ž‘์€ ฮด๋ฅผ ์‚ฐ์ถœํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค.

3.2 ํ”„๋กฌํ”„ํŠธ๊ฐ€ ์žˆ๋Š” ํ™˜์› - ํ˜„์‹ค์  ํ™•์žฅ

ํ”„๋กฌํ”„ํŠธ ๋ชจ๋ธ์˜ ํ˜•์‹์  ์ •์˜:

  • ํ”„๋กฌํ”„ํŠธ ๋ถ„ํฌ: ฮผ์—์„œ ์ถ”์ถœ๋œ ๋งฅ๋ฝ c โˆˆ C
  • ์˜ˆ์ œ ๊ตฌ์กฐ: x = (c, r) (ํ”„๋กฌํ”„ํŠธ c์™€ ์‘๋‹ต r์˜ ์Œ)
  • ๋งฅ๋ฝ๋ณ„ ๋ถ„ํ• :
    • V_c := {r (c, r) โˆˆ V} (์œ ํšจ ์‘๋‹ต)
    • E_c := {r (c, r) โˆˆ E} (์˜ค๋ฅ˜ ์‘๋‹ต)

์กฐ๊ฑด๋ถ€ ๋ถ„ํฌ๋กœ์˜ ํ™•์žฅ:

  • ํ›ˆ๋ จ ๋ถ„ํฌ: p(r c), ๊ธฐ๋ณธ ๋ชจ๋ธ: pฬ‚(r c)
  • ๊ฒฐํ•ฉ ๋ถ„ํฌ: p(c, r) := ฮผ(c)p(r c), pฬ‚(c, r) := ฮผ(c)pฬ‚(r c)

์ผ๋ฐ˜ํ™”๋œ IIV ๋ฌธ์ œ:

  • ๋™์ผํ•œ ๋ชฉํ‘œ ํ•จ์ˆ˜: f(x) := + iff x โˆˆ V
  • ์ผ๋ฐ˜ํ™”๋œ ๋ถ„ํฌ D: ๋“ฑํ™•๋ฅ ๋กœ x ~ p ๋˜๋Š” x = (c, r) for c ~ ฮผ, r โˆˆ E_c์—์„œ ๊ท ๋“ฑํ•˜๊ฒŒ ์„ ํƒ
  • ์ผ๋ฐ˜ํ™”๋œ ๋ถ„๋ฅ˜๊ธฐ: fฬ‚(c, r) := + iff pฬ‚(r c) > 1/min_c E_c

Theorem 1 - ์ฃผ์š” ์ •๋ฆฌ:
์ž„์˜์˜ ํ›ˆ๋ จ ๋ถ„ํฌ p(V) = 1๊ณผ ์ž„์˜์˜ ๊ธฐ๋ณธ ๋ชจ๋ธ pฬ‚์— ๋Œ€ํ•ด:
errโ‰ฅ2โ‹…erriivโˆ’maxโกcโˆฃVcโˆฃminโกcโˆฃEcโˆฃโˆ’ฮด\text{err} \geq 2 \cdot \text{err}_{iiv} - \frac{\max_c |V_c|}{\min_c |E_c|} - \deltaerrโ‰ฅ2โ‹…erriivโ€‹โˆ’mincโ€‹โˆฃEcโ€‹โˆฃmaxcโ€‹โˆฃVcโ€‹โˆฃโ€‹โˆ’ฮด

์—ฌ๊ธฐ์„œ ฮด := pฬ‚(A) - p(A) , A := {(c, r) โˆˆ X pฬ‚(r c) > 1/min_c E_c }

3.3 ๊ธฐ๋ณธ ๋ชจ๋ธ์˜ ์˜ค๋ฅ˜ ์š”์ธ๋“ค - ๊ตฌ์ฒด์  ๋ถ„์„

3.3.1 ์ž„์˜์  ์‚ฌ์‹ค ํ™˜๊ฐ - ์ธ์‹๋ก ์  ๋ถˆํ™•์‹ค์„ฑ

์ž„์˜์  ์‚ฌ์‹ค์˜ ์ˆ˜ํ•™์  ๋ชจ๋ธ:

Definition 1 (Arbitrary Facts):
๊ณ ์ •๋œ ์š”์†Œ๋“ค:

  • ์ž„์˜์˜ ํ”„๋กฌํ”„ํŠธ ๋ถ„ํฌ ฮผ(c)
  • IDK ์‘๋‹ต
  • ๊ฐ ํ”„๋กฌํ”„ํŠธ c์— ๋Œ€ํ•ด: ์‘๋‹ต ์ง‘ํ•ฉ R_c, ์‘๋‹ต ํ™•๋ฅ  ฮฑ_c โˆˆ [0, 1]

๋…๋ฆฝ์  ์ •๋‹ต ์„ ํƒ:
๊ฐ c์— ๋Œ€ํ•ด ๋…๋ฆฝ์ ์œผ๋กœ, ๋‹จ์ผ ์ •๋‹ต a_c โˆˆ R_c๊ฐ€ ๊ท ๋“ฑํ•˜๊ฒŒ ๋ฌด์ž‘์œ„๋กœ ์„ ํƒ๋ฉ๋‹ˆ๋‹ค.

  • p(a_c c) = ฮฑ_c
  • p(IDK c) = 1 - ฮฑ_c
  • ๋”ฐ๋ผ์„œ E_c = R_c \ {a_c}, V_c = {a_c, IDK}

์‹ฑ๊ธ€ํ†ค ๋น„์œจ์˜ ์ •์˜:

Definition 2 (Singleton rate):
ํ”„๋กฌํ”„ํŠธ c โˆˆ C๊ฐ€ ์‹ฑ๊ธ€ํ†ค์ด ๋˜๋Š” ์กฐ๊ฑด: N๊ฐœ ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ์—์„œ ๊ธฐ๊ถŒ ์—†์ด ์ •ํ™•ํžˆ ํ•œ ๋ฒˆ ๋‚˜ํƒ€๋‚จ:
|{i : c^(i) = c โˆง r^(i) โ‰  IDK}| = 1

์‹ฑ๊ธ€ํ†ค ์ง‘ํ•ฉ์„ S โІ C๋ผ ํ•˜๋ฉด:
sr=โˆฃSโˆฃN\text{sr} = \frac{|S|}{N}sr=NโˆฃSโˆฃโ€‹

Turing์˜ ๋ˆ„๋ฝ ์งˆ๋Ÿ‰ ์ถ”์ •๊ณผ์˜ ์—ฐ๊ฒฐ:

  • Alan Turing์˜ ์šฐ์•„ํ•œ ์ ‘๊ทผ: ์ •ํ™•ํžˆ ํ•œ ๋ฒˆ ๋‚˜ํƒ€๋‚˜๋Š” ์ƒ˜ํ”Œ์˜ ๋น„์œจ์„ ๋ฏธ์ถœํ˜„ ์‚ฌ๊ฑด ํ™•๋ฅ ์˜ ์ถ”์ •์น˜๋กœ ์‚ฌ์šฉ
  • ์ง๊ด€: ์‹ฑ๊ธ€ํ†ค๋“ค์€ ์ถ”๊ฐ€ ์ƒ˜ํ”Œ๋ง์—์„œ ์–ผ๋งˆ๋‚˜ ๋งŽ์€ ์ƒˆ๋กœ์šด ๊ฒฐ๊ณผ๋ฅผ ๋งŒ๋‚ ์ง€์— ๋Œ€ํ•œ ํ”„๋ก์‹œ ์—ญํ• 

Theorem 2 (Arbitrary Facts) - ํ•˜ํ•œ ๋ฐ ์ƒํ•œ:
์ž„์˜์  ์‚ฌ์‹ค ๋ชจ๋ธ์—์„œ, N๊ฐœ ํ›ˆ๋ จ ์ƒ˜ํ”Œ์„ ๋ฐ›์•„ pฬ‚๋ฅผ ์ถœ๋ ฅํ•˜๋Š” ์ž„์˜์˜ ์•Œ๊ณ ๋ฆฌ์ฆ˜์— ๋Œ€ํ•ด, โƒ—a = โŸจacโŸฉ{cโˆˆC}์™€ N๊ฐœ ํ›ˆ๋ จ ์˜ˆ์ œ์— ๋Œ€ํ•ด 99% ํ™•๋ฅ ๋กœ:

ํ•˜ํ•œ:
errโ‰ฅsrโˆ’2minโกcโˆฃEcโˆฃโˆ’35+6lnโกNNโˆ’ฮด\text{err} \geq \text{sr} - \frac{2}{\min_c |E_c|} - \frac{35 + 6 \ln N}{\sqrt{N}} - \deltaerrโ‰ฅsrโˆ’mincโ€‹โˆฃEcโ€‹โˆฃ2โ€‹โˆ’Nโ€‹35+6lnNโ€‹โˆ’ฮด

์ƒํ•œ: ๋ณด์ •๋œ pฬ‚ (ฮด = 0)๋ฅผ ์ถœ๋ ฅํ•˜๋Š” ํšจ์œจ์  ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด ์กด์žฌํ•˜์—ฌ 99% ํ™•๋ฅ ๋กœ:
errโ‰คsrโˆ’srmaxโกcโˆฃEcโˆฃ+1+13N\text{err} \leq \text{sr} - \frac{\text{sr}}{\max_c |E_c| + 1} + \frac{13}{\sqrt{N}}errโ‰คsrโˆ’maxcโ€‹โˆฃEcโ€‹โˆฃ+1srโ€‹+Nโ€‹13โ€‹

์‹ค์šฉ์  ์‹œ์‚ฌ์ :

  • 20%์˜ ์ƒ์ผ ์‚ฌ์‹ค์ด ์‚ฌ์ „ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ์—์„œ ์ •ํ™•ํžˆ ํ•œ ๋ฒˆ ๋‚˜ํƒ€๋‚˜๋ฉด, ๊ธฐ๋ณธ ๋ชจ๋ธ์ด ์ตœ์†Œ 20%์˜ ์ƒ์ผ ์‚ฌ์‹ค์—์„œ ํ™˜๊ฐํ•  ๊ฒƒ์œผ๋กœ ์˜ˆ์ƒ
  • ์ด๋Š” ๋นˆ๋„์™€ ํ™˜๊ฐ ์‚ฌ์ด์˜ ์ง์ ‘์  ๊ด€๊ณ„๋ฅผ ์ˆ˜ํ•™์ ์œผ๋กœ ํ™•๋ฆฝ

3.3.2 ๋ถˆ๋Ÿ‰ ๋ชจ๋ธ - ํ‘œํ˜„๋ ฅ๊ณผ ์ ํ•ฉ์„ฑ ๋ฌธ์ œ

Agnostic Learning ํ”„๋ ˆ์ž„์›Œํฌ:
์ฃผ์–ด์ง„ ๋ถ„๋ฅ˜๊ธฐ ํŒจ๋ฐ€๋ฆฌ G์˜ ์ตœ์†Œ ์˜ค๋ฅ˜์œจ:
opt(G):=minโกgโˆˆGPrโกxโˆผD[g(x)โ‰ f(x)]โˆˆ[0,1]\text{opt}(G) := \min_{g \in G} \Pr_{x \sim D}[g(x) \neq f(x)] \in [0, 1]opt(G):=mingโˆˆGโ€‹PrxโˆผDโ€‹[g(x)๎€ โ€‹=f(x)]โˆˆ[0,1]

์–ธ์–ด ๋ชจ๋ธ ๊ธฐ๋ฐ˜ ๋ถ„๋ฅ˜๊ธฐ ํŒจ๋ฐ€๋ฆฌ:
๋งค๊ฐœ๋ณ€์ˆ˜ ฮธ โˆˆ ฮ˜๋กœ ๋งค๊ฐœํ™”๋œ ์–ธ์–ด ๋ชจ๋ธ pฬ‚*ฮธ์— ๋Œ€ํ•ด:
\(G := {g*{ฮธ,t} | ฮธ โˆˆ ฮ˜, t โˆˆ [0, 1]}\)

gฮธ,t(c,r):={+ifย p^ฮธ(rโˆฃc)>tโˆ’ifย p^ฮธ(rโˆฃc)โ‰คtg_{ฮธ,t}(c, r) := \begin{cases} + & \text{if } \hat{p}_ฮธ(r c) > t \ - & \text{if } \hat{p}_ฮธ(r c) \leq t \end{cases}gฮธ,tโ€‹(c,r):={+โˆ’โ€‹ifย p^โ€‹ฮธโ€‹(rโˆฃc)>tifย p^โ€‹ฮธโ€‹(rโˆฃc)โ‰คtโ€‹

Theorem 1์—์„œ์˜ ์ง์ ‘์  ๋„์ถœ:
errโ‰ฅ2โ‹…opt(G)โˆ’maxโกcโˆฃVcโˆฃminโกcโˆฃEcโˆฃโˆ’ฮด\text{err} \geq 2 \cdot \text{opt}(G) - \frac{\max_c |V_c|}{\min_c |E_c|} - \deltaerrโ‰ฅ2โ‹…opt(G)โˆ’mincโ€‹โˆฃEcโ€‹โˆฃmaxcโ€‹โˆฃVcโ€‹โˆฃโ€‹โˆ’ฮด

์ˆœ์ˆ˜ ๋‹ค์ค‘ ์„ ํƒ ์‚ฌ๋ก€ - Theorem 3:
|V_c| = 1 for all c์ด๊ณ  C = min_c |E_c| + 1์ด ์„ ํƒ์ง€ ์ˆ˜๋ผ๋ฉด:
errโ‰ฅ2(1โˆ’1C)โ‹…opt(G)\text{err} \geq 2\left(1 - \frac{1}{C}\right) \cdot \text{opt}(G)errโ‰ฅ2(1โˆ’C1โ€‹)โ‹…opt(G)

๊ตฌ์ฒด์  ์˜ˆ์‹œ - ์‚ผ์ค‘ํ•ญ ๋ชจ๋ธ์˜ ํ•œ๊ณ„:

ํ”„๋กฌํ”„ํŠธ์™€ ์‘๋‹ต ์„ค๊ณ„:

  • cโ‚ = โ€œShe lost it and was completely out ofโ€ฆโ€
  • cโ‚‚ = โ€œHe lost it and was completely out ofโ€ฆโ€
  • rโ‚ = โ€œher mind.โ€, rโ‚‚ = โ€œhis mind.โ€
  • V{cโ‚} = E{cโ‚‚} = {rโ‚}, V{cโ‚‚} = E{cโ‚} = {rโ‚‚}

Corollary 2:
ฮผ๊ฐ€ {cโ‚, cโ‚‚}์— ๋Œ€ํ•ด ๊ท ๋“ฑ๋ถ„ํฌ๋ผ๋ฉด, ์ž„์˜์˜ ์‚ผ์ค‘ํ•ญ ๋ชจ๋ธ์€ ์ตœ์†Œ 1/2์˜ ์ƒ์„ฑ ์˜ค๋ฅ˜์œจ์„ ๊ฐ€์ ธ์•ผ ํ•ฉ๋‹ˆ๋‹ค.

์ฆ๋ช… ์Šค์ผ€์น˜: C = 2์ด๊ณ  ์‚ผ์ค‘ํ•ญ ๋ชจ๋ธ์— ๋Œ€ํ•ด opt(G) = 1/2์ด๋ฏ€๋กœ Theorem 3์—์„œ ์ง์ ‘ ๋”ฐ๋ผ์˜ต๋‹ˆ๋‹ค.

ํ˜„๋Œ€์  ์˜ˆ์‹œ - ๋ฌธ์ž ์„ธ๊ธฐ:
DeepSeek-R1 ์ถ”๋ก  ๋ชจ๋ธ์˜ 377-ํ† ํฐ ์‚ฌ๊ณ  ๊ณผ์ •:

1
2
3
"Let me spell it out: D-E-E-P-S-E-E-K.
First letter: D โ€” that's one D. Second letter: E โ€” not D. Third letter: E โ€” not D...
So, the number of Ds is 1."

ํ† ํฐํ™”์˜ ํ‘œํ˜„์  ๋„์ „:
ํ˜„๋Œ€ ์–ธ์–ด ๋ชจ๋ธ๋“ค์ด ๊ฐœ๋ณ„ ๋ฌธ์ž๊ฐ€ ์•„๋‹Œ ํ† ํฐ(์˜ˆ: D/EEP/SEE/K)์œผ๋กœ ํ”„๋กฌํ”„ํŠธ๋ฅผ ํ‘œํ˜„ํ•˜๋Š” ๊ฒƒ์ด ๋ฌธ์ž ์„ธ๊ธฐ ์ž‘์—…์˜ ํ‘œํ˜„์  ํ•œ๊ณ„๋ฅผ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.

3.4 ์ถ”๊ฐ€์  ์˜ค๋ฅ˜ ์š”์ธ๋“ค - ํฌ๊ด„์  ๋ถ„์„

๊ณ„์‚ฐ์  ์–ด๋ ค์›€ (Computational Hardness)

์•”ํ˜ธํ•™์  ์˜ˆ์‹œ:

  • ์•ˆ์ „ํ•œ ์•”ํ˜ธํ™” ์‹œ์Šคํ…œ์—์„œ๋Š” ํšจ์œจ์  ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด ์šฐ์—ฐ๋ณด๋‹ค ๋‚˜์€ ์ถ”์ธก์„ ํ•  ์ˆ˜ ์—†์Œ
  • Observation 2 (Appendix D): โ€œc์˜ ๋ณตํ˜ธํ™”๋Š” ๋ฌด์—‡์ธ๊ฐ€?โ€ ํ˜•ํƒœ์˜ ๋‹ค๋ฃจ๊ธฐ ์–ด๋ ค์šด ์ฟผ๋ฆฌ์— Theorem 1 ์ ์šฉ
  • ฮฒ-breaking ๋ณด์•ˆ ์ •์˜ ํ•˜์—์„œ ๋ณด์ •๋œ ์–ธ์–ด ๋ชจ๋ธ์€ 1 - ฮฒ - 2/( M - 1) - ฮด ์ด์ƒ์˜ ํ™•๋ฅ ๋กœ ์ž˜๋ชป๋œ ๋ณตํ˜ธํ™”๋ฅผ ์ถœ๋ ฅ

๋ถ„ํฌ ์ด๋™ (Distribution Shift)

์ „ํ†ต์  ๊ธฐ๊ณ„ํ•™์Šต ๋ฌธ์ œ:

  • ํ›ˆ๋ จ๊ณผ ํ…Œ์ŠคํŠธ ๋ฐ์ดํ„ฐ ๋ถ„ํฌ์˜ divergence (Quiรฑonero-Candela et al., 2009)
  • ์–ธ์–ด ๋ชจ๋ธ์—์„œ๋Š” OOD(Out-of-Distribution) ํ”„๋กฌํ”„ํŠธ๋กœ ๋‚˜ํƒ€๋‚จ
  • ์˜ˆ์‹œ: โ€œ๊นƒํ„ธ 1ํŒŒ์šด๋“œ์™€ ๋‚ฉ 1ํŒŒ์šด๋“œ ์ค‘ ์–ด๋А ๊ฒƒ์ด ๋” ๋ฌด๊ฑฐ์šด๊ฐ€?โ€ ๊ฐ™์€ ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ์— ์—†์„ ๋ฒ•ํ•œ ์งˆ๋ฌธ

GIGO: Garbage In, Garbage Out

ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ ํ’ˆ์งˆ์˜ ํ•œ๊ณ„:

  • ๋Œ€๊ทœ๋ชจ ํ›ˆ๋ จ ์ฝ”ํผ์Šค๋Š” ํ•„์—ฐ์ ์œผ๋กœ ๋งŽ์€ ์‚ฌ์‹ค์  ์˜ค๋ฅ˜ ํฌํ•จ
  • ๊ธฐ๋ณธ ๋ชจ๋ธ๋“ค์ด ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ์˜ ์˜ค๋ฅ˜๋ฅผ ๋ณต์ œํ•  ์ˆ˜ ์žˆ์Œ
  • Lin et al. (2022b), Levy et al. (2021), Alber et al. (2025)์˜ ์—ฐ๊ตฌ๋กœ ์ž…์ฆ

ํ›„ํ›ˆ๋ จ์œผ๋กœ์˜ ์ž์—ฐ์Šค๋Ÿฌ์šด ์ „ํ™˜:
GIGO๋Š” ์ผ๋ฐ˜์  ์˜คํ•ด์™€ ์Œ๋ชจ๋ก  ๊ฐ™์€ ํŠน์ • GIGO ์˜ค๋ฅ˜๋ฅผ ๊ฐ์†Œ์‹œํ‚ค๋Š” ํ›„ํ›ˆ๋ จ์œผ๋กœ์˜ ์ž์—ฐ์Šค๋Ÿฌ์šด ์—ฐ๊ฒฐ์ ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ ์ผ๋ถ€ ํ™˜๊ฐ์€ ์ง€์†๋˜๊ฑฐ๋‚˜ ์‹ฌ์ง€์–ด ์•…ํ™”๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.


๐Ÿ“– Chapter 4: Post-training and Hallucination - ํ›„ํ›ˆ๋ จ์—์„œ์˜ ํ™˜๊ฐ ์ง€์†์„ฑ

์ฑ•ํ„ฐ์˜ ํ•ต์‹ฌ ๊ธฐ์—ฌ

  1. ์‚ฌํšŒ๊ธฐ์ˆ ์  ์›์ธ ๊ทœ๋ช…: ํ™˜๊ฐ ์ง€์†์„ฑ์˜ ๊ทผ๋ณธ ์›์ธ์ด ํ‰๊ฐ€ ๋ฐฉ์‹ ์ž์ฒด์— ์žˆ์Œ์„ ์ž…์ฆ
  2. ๊ตฌ์กฐ์  ๋ฌธ์ œ ์ •๋Ÿ‰ํ™”: ์ฃผ๋ฅ˜ ๋ฒค์น˜๋งˆํฌ๋“ค์˜ ๋ฉ”ํƒ€ ๋ถ„์„์„ ํ†ตํ•œ ์ด์ง„ ์ฑ„์ ์˜ ์••๋„์  ๋น„์ค‘ ํ™•์ธ
  3. ์‹ค์šฉ์  ํ•ด๊ฒฐ์ฑ… ์ œ์‹œ: ๊ธฐ์กด ๋ฒค์น˜๋งˆํฌ์˜ ๋‹จ์ˆœ ์ˆ˜์ •์„ ํ†ตํ•œ ์ ์ง„์  ๊ฐœ์„  ๋ฐฉ์•ˆ
  4. ํ–‰๋™ ๋ณด์ • ๊ฐœ๋…: ์ƒˆ๋กœ์šด ํ‰๊ฐ€ ํŒจ๋Ÿฌ๋‹ค์ž„์œผ๋กœ์„œ์˜ ํ–‰๋™ ๋ณด์ • ๋„์ž…

์ด ์žฅ์€ ์‚ฌ์ „ํ›ˆ๋ จ ์ดํ›„์—๋„ ํ™˜๊ฐ์ด ์ง€์†๋˜๋Š” ์ด์œ ๋ฅผ ์‚ฌํšŒ๊ธฐ์ˆ ์  ๊ด€์ ์—์„œ ๋ถ„์„ํ•˜๊ณ , ํ‰๊ฐ€ ๋ฐฉ์‹ ์ž์ฒด๊ฐ€ ํ™˜๊ฐ์„ ๊ฐ•ํ™”ํ•œ๋‹ค๋Š” ํ•ต์‹ฌ ํ†ต์ฐฐ์„ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค. ๋‹จ์ˆœํžˆ ๋” ๋‚˜์€ ํ›„ํ›ˆ๋ จ ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ์ œ์•ˆํ•˜๋Š” ๋Œ€์‹ , ๊ธฐ์กด ํ‰๊ฐ€ ์‹œ์Šคํ…œ์˜ ๊ตฌ์กฐ์  ๋ฌธ์ œ๋ฅผ ์ง€์ ํ•˜๊ณ  ์‹ค์šฉ์  ํ•ด๊ฒฐ์ฑ…์„ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค.

4.1 ํ‰๊ฐ€ ๋ฐฉ์‹์ด ํ™˜๊ฐ์„ ๊ฐ•ํ™”ํ•˜๋Š” ๋ฉ”์ปค๋‹ˆ์ฆ˜

์ด์ง„ ํ‰๊ฐ€์˜ ๊ตฌ์กฐ์  ๋ฌธ์ œ์ 

์ž˜๋ชป๋œ ์ด๋ถ„๋ฒ•์˜ ๊ฐ•์š”:
ํ˜„์žฌ ์–ธ์–ด ๋ชจ๋ธ ํ‰๊ฐ€๋“ค์ด ๋ถ€๊ณผํ•˜๋Š” ๊ฑฐ์ง“ ์ •๋‹ต-์˜ค๋‹ต ์ด๋ถ„๋ฒ•์€ ๋‹ค์Œ๊ณผ ๊ฐ™์€ ์œ ์šฉํ•œ ์‘๋‹ต๋“ค์— ์ „ํ˜€ ์ ์ˆ˜๋ฅผ ์ฃผ์ง€ ์•Š์Šต๋‹ˆ๋‹ค:

  • ๋ถˆํ™•์‹ค์„ฑ ํ‘œํ˜„: โ€œํ™•์‹คํ•˜์ง€ ์•Š์Šต๋‹ˆ๋‹คโ€, โ€œ์ •ํ™•ํžˆ ๋ชจ๋ฅด๊ฒ ์Šต๋‹ˆ๋‹คโ€
  • ๋ชจํ˜ธํ•œ ์„ธ๋ถ€์‚ฌํ•ญ ์ƒ๋žต: ๋ถˆํ™•์‹คํ•œ ๊ตฌ์ฒด์  ์ •๋ณด ๋Œ€์‹  ํ™•์‹คํ•œ ์ผ๋ฐ˜์  ์ •๋ณด ์ œ๊ณต
  • ๋ช…ํ™•ํ™” ์š”์ฒญ: โ€œ์–ด๋–ค ์ข…๋ฅ˜์˜ ์ „ํ™”๋ฅผ ๋ง์”€ํ•˜์‹œ๋Š” ๊ฑด๊ฐ€์š”?โ€ (ํœด๋Œ€ํฐ vs ์œ ์„ ์ „ํ™”)

์ฃผ๋ฅ˜ ์ง€ํ‘œ๋“ค์˜ ์ด์ง„์  ํŠน์„ฑ:

  • ์ •ํ™•๋„(Accuracy): ๋งž์Œ/ํ‹€๋ฆผ์˜ ๋‹จ์ˆœ ์ด๋ถ„๋ฒ•
  • ํ†ต๊ณผ์œจ(Pass rate): ๊ธฐ์ค€ ํ†ต๊ณผ/๋ฏธํ†ต๊ณผ์˜ ์ด๋ถ„๋ฒ•
  • ์ด๋Ÿฌํ•œ ์ง€ํ‘œ๋“ค์ด ๋ถ„์•ผ์˜ ์ง€๋ฐฐ์  ๊ทœ๋ฒ”์ž„์„ ์ €์ž๋“ค์ด ๊ฐ•์กฐ

Observation 1 - ์ˆ˜ํ•™์  ์ฆ๋ช…:
์ž„์˜์˜ ํ”„๋กฌํ”„ํŠธ c์— ๋Œ€ํ•ด, ์ด์ง„ ์ฑ„์ ์ž์— ๋Œ€ํ•œ ์ž„์˜์˜ ๋ถ„ํฌ ฯ*c์—์„œ:
\(A\_c \cap \arg\max*{r \in R*c} E*{g\_c \sim \rho\_c}[g\_c(r)] = \emptyset\)

์—ฌ๊ธฐ์„œ A_c โŠ‚ R_c๋Š” ๊ทธ๋Ÿด๋“ฏํ•œ ๊ธฐ๊ถŒ ์‘๋‹ต๋“ค์˜ ์ง‘ํ•ฉ์ž…๋‹ˆ๋‹ค.

์ฆ๋ช…์˜ ํ•ต์‹ฌ ์•„์ด๋””์–ด:

  • ์ด์ง„ ์ฑ„์ ์ž g_c์— ๋Œ€ํ•ด ๋ชจ๋“  r โˆˆ A_c๋Š” g_c(r) = 0
  • ํ•˜์ง€๋งŒ R_c \ A_c์—์„œ ์ผ๋ถ€ rโ€™์— ๋Œ€ํ•ด Pr[g_c(rโ€™) = 1] > 0
  • ๋”ฐ๋ผ์„œ ๊ธฐ๊ถŒ์€ ํ•ญ์ƒ ์ฐจ์„ ์ฑ…

โ€œ์ „์—ผ๋ณ‘(Epidemic)โ€ ๊ฐœ๋…์˜ ์‹ฌ์ธต ๋ถ„์„

Model A vs Model B ์‚ฌ๊ณ ์‹คํ—˜:

Model A (์ •๋ ฌ๋œ ๋ชจ๋ธ)์˜ ํŠน์„ฑ:

  • ์˜ฌ๋ฐ”๋ฅด๊ฒŒ ๋ถˆํ™•์‹ค์„ฑ์„ ์‹ ํ˜ธ
  • ์ ˆ๋Œ€ ํ™˜๊ฐํ•˜์ง€ ์•Š์Œ
  • ํ™•์‹คํ•˜์ง€ ์•Š์„ ๋•Œ ์ ์ ˆํžˆ ๊ธฐ๊ถŒ

Model B (์ถ”์ธก ๋ชจ๋ธ)์˜ ํŠน์„ฑ:

  • Model A์™€ ์œ ์‚ฌํ•˜์ง€๋งŒ ๋ถˆํ™•์‹ค์„ฑ ํ‘œ์‹œ ์—†์Œ
  • ๋ถˆํ™•์‹คํ•  ๋•Œ ํ•ญ์ƒ โ€œ์ตœ์„ ์˜ ์ถ”์ธกโ€ ์ œ๊ณต
  • ๊ณผ์‹ ์ ์ด๊ณ  ๊ตฌ์ฒด์ ์ธ ๊ฑฐ์ง“ ์ •๋ณด ์ƒ์„ฑ

0-1 ์ฑ„์ ์—์„œ์˜ ์—ญ์„ค์  ๊ฒฐ๊ณผ:
Model B๊ฐ€ Model A๋ณด๋‹ค ๋” ๋†’์€ ์ ์ˆ˜๋ฅผ ๋ฐ›๊ฒŒ ๋ฉ๋‹ˆ๋‹ค:

  • Model A: ์ •ํ™•ํ•œ ๋‹ต๋ณ€์—๋งŒ ์ ์ˆ˜, ๊ธฐ๊ถŒ์—๋Š” 0์ 
  • Model B: ์ •ํ™•ํ•œ ๋‹ต๋ณ€ + ์šด ์ข‹์€ ์ถ”์ธก์— ์ ์ˆ˜

๋ฉ”ํƒ€ ํ‰๊ฐ€ ๊ฒฐ๊ณผ - Table 2์˜ ์ฒด๊ณ„์  ๋ถ„์„:

์ €์ž๋“ค์ด ์ฃผ์š” ๋ฒค์น˜๋งˆํฌ๋“ค์„ ๋ถ„์„ํ•œ ๊ฒฐ๊ณผ:

๋Œ€ํ‘œ์  ์ด์ง„ ์ฑ„์  ๋ฒค์น˜๋งˆํฌ๋“ค:

  1. GPQA: ๋‹ค์ค‘ ์„ ํƒ ์ •ํ™•๋„, IDK ํฌ๋ ˆ๋”ง ์—†์Œ
  2. MMLU-Pro: ๋‹ค์ค‘ ์„ ํƒ ์ •ํ™•๋„, IDK ํฌ๋ ˆ๋”ง ์—†์Œ
  3. IFEval: ํ”„๋กœ๊ทธ๋ž˜๋งคํ‹ฑ ์ง€์‹œ ๊ฒ€์ฆ, IDK ํฌ๋ ˆ๋”ง ์—†์Œ
  4. Omni-MATH: ๋“ฑ๊ฐ€์„ฑ ์ฑ„์ , IDK ํฌ๋ ˆ๋”ง ์—†์Œ
  5. BBH: ๋‹ค์ค‘ ์„ ํƒ/์ •ํ™•ํžˆ ์ผ์น˜, IDK ํฌ๋ ˆ๋”ง ์—†์Œ
  6. MATH (L5 split): ๋“ฑ๊ฐ€์„ฑ ์ฑ„์ , IDK ํฌ๋ ˆ๋”ง ์—†์Œ
  7. SWE-bench: ํŒจ์น˜๊ฐ€ ๋‹จ์œ„ ํ…Œ์ŠคํŠธ ํ†ต๊ณผ ์—ฌ๋ถ€, IDK ํฌ๋ ˆ๋”ง ์—†์Œ

์œ ์ผํ•œ ์˜ˆ์™ธ - WildBench:

  • LM ๊ธฐ๋ฐ˜ ๋ฃจ๋ธŒ๋ฆญ ์‚ฌ์šฉ (1-10 ์ ์ˆ˜)
  • IDK๊ฐ€ ๋ถ€๋ถ„์  ํฌ๋ ˆ๋”ง ํš๋“ ๊ฐ€๋Šฅ
  • ํ•˜์ง€๋งŒ ๋ฌธ์ œ์  ์ฑ„์ : IDK๋Š” โ€œ๊ณต์ •ํ•œโ€ ์‘๋‹ต๋ณด๋‹ค ๋‚ฎ์€ ์ ์ˆ˜ (3-4์  vs 5-6์ )
  • ๋”ฐ๋ผ์„œ ์—ฌ์ „ํžˆ ํ™˜๊ฐ์„ ๊ฐ•ํ™”ํ•˜๋Š” ๊ตฌ์กฐ

์†Œ์ˆ˜ ํ™˜๊ฐ ํ‰๊ฐ€์˜ ํ•œ๊ณ„

์••๋„์  ๋ถˆ๊ท ํ˜• ๋ฌธ์ œ:

  • ์ฃผ๋ฅ˜ ํ‰๊ฐ€๋“ค์˜ ์••๋„์  ๋‹ค์ˆ˜๊ฐ€ ์ด์ง„ ์ฑ„์ 
  • ์†Œ์ˆ˜์˜ ํ™˜๊ฐ ์ „์šฉ ํ‰๊ฐ€๋กœ๋Š” ๊ตฌ์กฐ์  ๋ถˆ๊ท ํ˜• ํ•ด๊ฒฐ ๋ถˆ๊ฐ€๋Šฅ
  • โ€œ์™„๋ฒฝํ•œ ํ™˜๊ฐ ํ‰๊ฐ€โ€๋ฅผ ์ถ”๊ตฌํ•˜๋Š” ๊ธฐ์กด ์—ฐ๊ตฌ ๋ฐฉํ–ฅ์˜ ํ•œ๊ณ„ ์ง€์ 

๊ทผ๋ณธ ์›์ธ์˜ ์‹๋ณ„:
๋ฌธ์ œ๋Š” ํ™˜๊ฐ ํ‰๊ฐ€์˜ ๋ถ€์กฑ์ด ์•„๋‹ˆ๋ผ ์ •๋ ฌ๋˜์ง€ ์•Š์€ ํ‰๊ฐ€์˜ ๊ณผ๋‹ค์ž…๋‹ˆ๋‹ค.

4.2 ๋ช…์‹œ์  ์‹ ๋ขฐ๋„ ๋ชฉํ‘œ - ์‹ค์šฉ์  ํ•ด๊ฒฐ์ฑ…

์ธ๊ฐ„ ์‹œํ—˜๊ณผ์˜ ์œ ์‚ฌ์„ฑ ๋ถ„์„

์ž˜๋ชป๋œ ๋‹ต๋ณ€์— ํŒจ๋„ํ‹ฐ๊ฐ€ ์žˆ๋Š” ์‹œํ—˜๋“ค:
์ €์ž๋“ค์ด ์‹ค์ œ ์กด์žฌํ•˜๋Š” ์‹œํ—˜ ์‚ฌ๋ก€๋“ค์„ ์ œ์‹œ:

๊ตญ์ œ์  ํ‘œ์ค€ํ™” ์‹œํ—˜๋“ค:

  • ์ธ๋„: JEE (Joint Entrance Examination), NEET, GATE ์‹œํ—˜
  • ๋ฏธ๊ตญ: ๊ณผ๊ฑฐ์˜ SAT, AP, GRE ํ…Œ์ŠคํŠธ
  • ์ˆ˜ํ•™: Mathematical Association of America์˜ AMC ํ…Œ์ŠคํŠธ

ํ•ต์‹ฌ ํŠน์ง•:

  1. ๋ช…์‹œ์  ์ฑ„์  ๋ฐฉ์‹ ๊ณ ์ง€: ์‹œํ—˜ ์ง€์‹œ์‚ฌํ•ญ์— ๋ช…ํ™•ํžˆ ๊ธฐ์žฌ
  2. ์‹ ๋ขฐ๋„ ์ž„๊ณ„๊ฐ’ ์ธ์‹: ์ˆ˜ํ—˜์ž๋“ค์ด ์–ธ์ œ ์ถ”์ธกํ• ์ง€ ์•Œ๊ณ  ์žˆ์Œ
  3. ํˆฌ๋ช…ํ•œ ์œ„ํ—˜-๋ณด์ƒ ๊ตฌ์กฐ: ์ •๋‹ต ์‹œ ์–ป๋Š” ์ ์ˆ˜ ๋Œ€๋น„ ์˜ค๋‹ต ์‹œ ์žƒ๋Š” ์ ์ˆ˜๊ฐ€ ๋ช…ํ™•

์ œ์•ˆํ•˜๋Š” ํ•ด๊ฒฐ์ฑ…์˜ ๊ตฌ์ฒด์  ์„ค๊ณ„

๋ช…์‹œ์  ์‹ ๋ขฐ๋„ ๋ชฉํ‘œ ๋ฌธ๊ตฌ:
๊ฐ ์งˆ๋ฌธ์— ๋‹ค์Œ๊ณผ ๊ฐ™์€ ๋ฌธ๊ตฌ๋ฅผ ์ถ”๊ฐ€:

โ€œt ์ด์ƒ ํ™•์‹ ํ•  ๋•Œ๋งŒ ๋‹ตํ•˜์‹œ์˜ค. ์‹ค์ˆ˜๋Š” t/(1-t) ์  ๊ฐ์ ๋˜๊ณ , ์ •๋‹ต์€ 1์ , โ€˜๋ชจ๋ฅด๊ฒ ๋‹คโ€™๋Š” 0์ ์ž…๋‹ˆ๋‹ค.โ€

์ž์—ฐ์Šค๋Ÿฌ์šด ์ž„๊ณ„๊ฐ’๋“ค:

  • t = 0.5 (ํŒจ๋„ํ‹ฐ 1): 50% ์ด์ƒ ํ™•์‹ ํ•  ๋•Œ๋งŒ ๋‹ต๋ณ€
  • t = 0.75 (ํŒจ๋„ํ‹ฐ 3): 75% ์ด์ƒ ํ™•์‹ ํ•  ๋•Œ๋งŒ ๋‹ต๋ณ€
  • t = 0.9 (ํŒจ๋„ํ‹ฐ 9): 90% ์ด์ƒ ํ™•์‹ ํ•  ๋•Œ๋งŒ ๋‹ต๋ณ€
  • t = 0 (ํŒจ๋„ํ‹ฐ 0): ๊ธฐ์กด ์ด์ง„ ์ฑ„์  = โ€œ๋ถˆํ™•์‹คํ•ด๋„ ์ตœ์„ ์˜ ์ถ”์ธก์„ ํ•˜๋ผโ€

์ˆ˜ํ•™์  ์ •๋‹นํ™”:
๋‹ต๋ณ€์˜ ๊ธฐ๋Œ“๊ฐ’์ด IDK(์ ์ˆ˜ 0)๋ฅผ ์ด๊ธฐ๋Š” ์กฐ๊ฑด:
์ •ํ™•๋„ ํ™•๋ฅ  ร— 1 + ์˜ค๋‹ต ํ™•๋ฅ  ร— (-t/(1-t)) > 0
โŸบ ์ •ํ™•๋„ ํ™•๋ฅ  > t

๋”ฐ๋ผ์„œ t๋ฅผ ๋ช…์‹œํ•จ์œผ๋กœ์จ ๋ชจ๋ธ์ด ์ •ํ™•ํžˆ t ์ด์ƒ ํ™•์‹ ํ•  ๋•Œ๋งŒ ๋‹ตํ•˜๋Š” ๊ฒƒ์ด ์ˆ˜ํ•™์ ์œผ๋กœ ์ตœ์ ์ด ๋ฉ๋‹ˆ๋‹ค.

๊ธฐ์กด ์ ‘๊ทผ๋ฒ•๊ณผ์˜ ์ฐจ๋ณ„์ 

์ฒซ ๋ฒˆ์งธ ์ฐจ๋ณ„์  - ๋ช…์‹œ์„ฑ:

  • ๊ธฐ์กด ์—ฐ๊ตฌ: ๋Œ€๋ถ€๋ถ„ ์‹ ๋ขฐ๋„ ๋ชฉํ‘œ๋‚˜ ํŒจ๋„ํ‹ฐ๋ฅผ ์ง€์‹œ์‚ฌํ•ญ์—์„œ ์ƒ๋žต
  • ๋ณธ ์—ฐ๊ตฌ: ์‹ ๋ขฐ๋„ ์ž„๊ณ„๊ฐ’์„ ๋ช…์‹œ์ ์œผ๋กœ ์ง€์‹œ์‚ฌํ•ญ์— ํฌํ•จ
  • ์˜ˆ์™ธ: Wu et al. (2025)์˜ โ€œ์œ„ํ—˜ ๊ณ ์ง€โ€ ํ”„๋กฌํ”„ํŠธ๋Š” ๋ช…์‹œ์  ํŒจ๋„ํ‹ฐ ์‚ฌ์šฉ

๋ช…์‹œ์„ฑ์˜ ์ค‘์š”์„ฑ:

  • ๊ฐ๊ด€์  ์ฑ„์  ๊ฐ€๋Šฅ: ์ž„๊ณ„๊ฐ’์ด ๋ช…์‹œ๋˜์–ด ์žˆ์œผ๋ฉด ๊ณต์ •ํ•œ ํ‰๊ฐ€ ๊ธฐ์ค€ ์„ค์ •
  • ํ•ฉ์˜ ํ˜•์„ฑ ์šฉ์ด: ์–ธ์–ด ๋ชจ๋ธ ๊ฐœ๋ฐœ์ž๋“ค ๊ฐ„ ๋ช…ํ™•ํ•œ ๊ธฐ์ค€์  ์ œ๊ณต
  • ํ•™์ƒ๋“ค๋„ ๋ถˆ๊ณต์ •ํ•˜๋‹ค๊ณ  ๋А๋ผ์ง€ ์•Š์Œ: ์ฑ„์  ๊ธฐ์ค€์ด ํˆฌ๋ช…ํ•˜๊ฒŒ ๊ณต๊ฐœ๋จ

๋‘ ๋ฒˆ์งธ ์ฐจ๋ณ„์  - ์ฃผ๋ฅ˜ ํ‰๊ฐ€ ํ†ตํ•ฉ:

  • ๊ธฐ์กด ์—ฐ๊ตฌ: ์ฃผ๋กœ ์ „์šฉ ํ™˜๊ฐ ํ‰๊ฐ€์—์„œ ์•”์‹œ์  ์˜ค๋ฅ˜ ํŒจ๋„ํ‹ฐ ๋„์ž…
  • ๋ณธ ์—ฐ๊ตฌ: SWE-bench ๊ฐ™์€ ๊ธฐ์กด ์ฃผ๋ฅ˜ ํ‰๊ฐ€์— ์‹ ๋ขฐ๋„ ๋ชฉํ‘œ ํ†ตํ•ฉ ์ œ์•ˆ

์ฃผ๋ฅ˜ ํ‰๊ฐ€ ํ†ตํ•ฉ์˜ ์žฅ์ :

  • ์ •ํ™•๋„-์˜ค๋ฅ˜ ํŠธ๋ ˆ์ด๋“œ์˜คํ”„ ๋ฌธ์ œ ํ•ด๊ฒฐ
  • ์ ์ ˆํ•œ ๋ถˆํ™•์‹ค์„ฑ ํ‘œํ˜„์— ๋Œ€ํ•œ ํŒจ๋„ํ‹ฐ ๊ฐ์†Œ
  • ํ™˜๊ฐ ์ „์šฉ ํ‰๊ฐ€์˜ ํšจ๊ณผ์„ฑ ์ฆํญ

ํ–‰๋™ ๋ณด์ • (Behavioral Calibration) ๊ฐœ๋…

๊ธฐ์กด ๋ณด์ •๊ณผ์˜ ์ฐจ์ด:

  • ํ™•๋ฅ ์  ์‹ ๋ขฐ๋„ ์ถœ๋ ฅ: ๋ชจ๋ธ์ด โ€œ87% ํ™•์‹ ํ•ฉ๋‹ˆ๋‹คโ€ ๊ฐ™์€ ์ˆ˜์น˜ ์ œ๊ณต
  • ํ–‰๋™ ๋ณด์ •: ํŠน์ • ์ž„๊ณ„๊ฐ’์—์„œ ๊ฐ€์žฅ ์œ ์šฉํ•œ ์‘๋‹ต ํ˜•์„ฑ

ํ–‰๋™ ๋ณด์ •์˜ ์ •์˜:
๋ชจ๋“  ์ž„๊ณ„๊ฐ’์—์„œ ๋™์‹œ์— ์ตœ์ ์ธ ํ–‰๋™์ด ์กด์žฌ:
ํ•ด๋‹น ์ž„๊ณ„๊ฐ’๋ณด๋‹ค ๋†’์€ ์ •ํ™•๋„ ํ™•๋ฅ ์„ ๊ฐ€์ง„ ์˜ˆ์ œ์—์„œ๋งŒ ๋‹ต๋ณ€ํ•˜๊ณ , ๋‚˜๋จธ์ง€์—์„œ๋Š” IDK ์ถœ๋ ฅ

๊ฐ์‚ฌ ๋ฐ ํ‰๊ฐ€ ๋ฐฉ๋ฒ•:

  • ์ž„๊ณ„๊ฐ’๋ณ„๋กœ ์ •ํ™•๋„์™€ ์˜ค๋ฅ˜์œจ ๋น„๊ต
  • ์ง€์ˆ˜์ ์œผ๋กœ ๋งŽ์€ ์ •๋‹ต ํ‘œํ˜„ ๋ฐฉ์‹ ๋ฌธ์ œ ์šฐํšŒ (Farquhar et al., 2024)
  • ๊ธฐ์กด ๋ชจ๋ธ๋“ค์ด ํ–‰๋™ ๋ณด์ •์„ ๋ณด์ด๋Š”์ง€ ํ™•์ธ ๊ฐ€๋Šฅ

๊ฐ๊ด€์  ํ‰๊ฐ€๋กœ์„œ์˜ ๊ฐ€์น˜:
ํ–‰๋™ ๋ณด์ •์€ ๋ชจ๋ธ์˜ ๋ถˆํ™•์‹ค์„ฑ ์ฒ˜๋ฆฌ ๋Šฅ๋ ฅ์„ ํ‰๊ฐ€ํ•˜๋Š” ์ƒˆ๋กœ์šด ๊ฐ๊ด€์  ์ง€ํ‘œ๋กœ ํ™œ์šฉ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.


๐Ÿ“– Chapter 5: Discussion and Limitations - ์—ฐ๊ตฌ์˜ ํ•œ๊ณ„์™€ ํ™•์žฅ ๊ฐ€๋Šฅ์„ฑ

์ฑ•ํ„ฐ์˜ ํ•ต์‹ฌ ๊ธฐ์—ฌ

  1. ํ•œ๊ณ„ ์ธ์ •์˜ ์ •์ง์„ฑ: ์ œ์‹œ๋œ ํ”„๋ ˆ์ž„์›Œํฌ์˜ ํ•œ๊ณ„๋ฅผ ์ˆจ๊ธฐ์ง€ ์•Š๊ณ  ๋ช…ํ™•ํžˆ ๊ธฐ์ˆ 
  2. ํ™•์žฅ ๊ฐ€๋Šฅ์„ฑ ์ œ์‹œ: ๊ฐ ํ•œ๊ณ„์ ์— ๋Œ€ํ•œ ๊ตฌ์ฒด์ ์ธ ํ–ฅํ›„ ์—ฐ๊ตฌ ๋ฐฉํ–ฅ ์ œ์‹œ
  3. ์‹ค์šฉ์„ฑ๊ณผ ์ด๋ก ์˜ ๊ท ํ˜•: ์™„๋ฒฝํ•œ ์ด๋ก ๋ณด๋‹ค๋Š” ์‹ค์šฉ์  ๊ฐœ์„ ์— ์ดˆ์ 
  4. ๋ฏธ๋ž˜ ์—ฐ๊ตฌ ์˜์ œ ์„ค์ •: ์–ธ์–ด์  ๋ณด์ •, ํ™”์šฉ๋ก ์  ๋Šฅ๋ ฅ ๋“ฑ ์ƒˆ๋กœ์šด ์—ฐ๊ตฌ ์˜์—ญ ๊ฐœ์ฒ™

์ด ์žฅ์€ ์ œ์‹œ๋œ ์ด๋ก ์  ํ”„๋ ˆ์ž„์›Œํฌ์™€ ์‹ค์šฉ์  ํ•ด๊ฒฐ์ฑ…์˜ ์ ์šฉ ๋ฒ”์œ„์™€ ํ•œ๊ณ„์ ์„ ์ •์งํ•˜๊ณ  ๊ท ํ˜•์žกํžŒ ์‹œ๊ฐ์œผ๋กœ ๊ฒ€ํ† ํ•ฉ๋‹ˆ๋‹ค. ๊ฐ ํ•œ๊ณ„์ ์— ๋Œ€ํ•ด ํ–ฅํ›„ ์—ฐ๊ตฌ ๋ฐฉํ–ฅ์„ ์ œ์‹œํ•จ์œผ๋กœ์จ, ์ด๋ก ์˜ ํ™•์žฅ ๊ฐ€๋Šฅ์„ฑ๊ณผ ์‹ค์šฉ์  ์ ์šฉ์—์„œ์˜ ๊ณ ๋ ค์‚ฌํ•ญ๋“ค์„ ์ฒด๊ณ„์ ์œผ๋กœ ๋‹ค๋ฃน๋‹ˆ๋‹ค.

1. ๊ทธ๋Ÿด๋“ฏํ•จ๊ณผ ๋ฌด์˜๋ฏธํ•จ์˜ ๊ฒฝ๊ณ„ ๋ฌธ์ œ

ํ˜„์žฌ ํ”„๋ ˆ์ž„์›Œํฌ์˜ ๋ฒ”์œ„

๊ทธ๋Ÿด๋“ฏํ•œ ๊ฑฐ์ง“์— ๋Œ€ํ•œ ์ง‘์ค‘:

  • ํ™˜๊ฐ์˜ ์ •์˜: โ€œ๊ทธ๋Ÿด๋“ฏํ•œ ๊ฑฐ์ง“โ€
  • ๋ฌด์˜๋ฏธํ•œ ๋ฌธ์ž์—ด์€ ํ˜„์žฌ ๋ถ„์„์—์„œ ์ œ์™ธ
  • ํ˜„์‹ค์  ๊ทผ๊ฑฐ: ์ตœ์ฒจ๋‹จ ์–ธ์–ด ๋ชจ๋ธ๋“ค์ด ๋ฌด์˜๋ฏธํ•œ ๋ฌธ์ž์—ด์„ ๊ฑฐ์˜ ์ƒ์„ฑํ•˜์ง€ ์•Š์Œ

ํ™•์žฅ๋œ ํ”„๋ ˆ์ž„์›Œํฌ๋กœ์˜ ์ˆ˜์ • ๊ฐ€๋Šฅ์„ฑ

์ˆ˜์ •๋œ ๋ถ„ํ•  ๊ตฌ์กฐ:
์ „์ฒด ์ง‘ํ•ฉ์„ ์„ธ ๋ถ€๋ถ„์œผ๋กœ ํ™•์žฅ:

  • X = N โˆช E โˆช V
    • N: ๋ฌด์˜๋ฏธํ•œ ์˜ˆ์ œ๋“ค (nonsensical examples)
    • E: ์˜ค๋ฅ˜ ์˜ˆ์ œ๋“ค (error examples)
    • V: ์œ ํšจํ•œ ์˜ˆ์ œ๋“ค (valid examples)

์ˆ˜์ •๋œ ์ •์˜๋“ค:

  • err := pฬ‚(N โˆช E) (๋ฌด์˜๋ฏธํ•จ๊ณผ ์˜ค๋ฅ˜๋ฅผ ๋ชจ๋‘ ํฌํ•จ)
  • D(N) = 0 (ํ›ˆ๋ จ ๋ถ„ํฌ์—์„œ ๋ฌด์˜๋ฏธํ•œ ์˜ˆ์ œ๋Š” 0 ํ™•๋ฅ )
  • p(V) = 1 (์œ ํšจํ•œ ์˜ˆ์ œ๋งŒ ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ์— ํฌํ•จ)

์ด๋ก ์  ๊ฐ•๊ฑด์„ฑ:
์ €์ž๋“ค์ด ๊ฐ•์กฐํ•˜๋Š” ์ค‘์š”ํ•œ ์ : Theorem 1์˜ ์ง„์ˆ ๊ณผ ์ฆ๋ช…์ด ์ด ์ˆ˜์ •๋œ ์ •์˜์—์„œ๋„ ๊ทธ๋Œ€๋กœ ์„ฑ๋ฆฝํ•œ๋‹ค๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค.

2. ๊ฐœ๋ฐฉํ˜• ์ƒ์„ฑ์˜ ๋ณต์žก์„ฑ

ํ˜„์žฌ ์—ฐ๊ตฌ์˜ ์ดˆ์ ๊ณผ ํ•œ๊ณ„

๋‹จ์ผ ์‚ฌ์‹ค์  ์งˆ๋ฌธ ์ค‘์‹ฌ:

  • ๋…ผ๋ฌธ์—์„œ ์ œ์‹œ๋œ ๋Œ€๋ถ€๋ถ„์˜ ์˜ˆ์ œ๋“ค์ด ๋ช…ํ™•ํ•œ ๋‹ต์ด ์žˆ๋Š” ์งˆ๋ฌธ๋“ค
  • โ€œAdam Kalai์˜ ์ƒ์ผ์€?โ€, โ€œ๋…ผ๋ฌธ ์ œ๋ชฉ์€?โ€ ๋“ฑ

๊ฐœ๋ฐฉํ˜• ํ”„๋กฌํ”„ํŠธ์˜ ๋„์ „:
๋ณต์žกํ•œ ์ƒ์„ฑ ์ž‘์—…์˜ ์˜ˆ์‹œ:

โ€œWrite a biography about [person]โ€ฆโ€

์ด๋Ÿฐ ํ”„๋กฌํ”„ํŠธ์—์„œ๋Š” ๋‹จ์ผํ•œ โ€œ์ •๋‹ตโ€์ด ์กด์žฌํ•˜์ง€ ์•Š์œผ๋ฉฐ, ๋ถ€๋ถ„์  ํ™˜๊ฐ์ด๋‚˜ ์ •๋„์˜ ์ฐจ์ด๊ฐ€ ์กด์žฌํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

ํ”„๋ ˆ์ž„์›Œํฌ ํ™•์žฅ ๋ฐฉ์•ˆ

๋ณตํ•ฉ์  ํ™˜๊ฐ ์ •์˜:

  • ํ•˜๋‚˜ ์ด์ƒ์˜ ๊ฑฐ์ง“์„ ํฌํ•จํ•˜๋Š” ์‘๋‹ต์„ ์˜ค๋ฅ˜๋กœ ์ •์˜
  • ํ•˜์ง€๋งŒ ์ด ๊ฒฝ์šฐ ํ™˜๊ฐ์˜ ์ •๋„๋ฅผ ๊ณ ๋ คํ•˜๋Š” ๊ฒƒ์ด ์ž์—ฐ์Šค๋Ÿฌ์›€
  • ๋ช‡ ๊ฐœ์˜ ์˜ค๋ฅ˜๊ฐ€ ์žˆ๋Š”์ง€์— ๋”ฐ๋ฅธ ์ฐจ๋“ฑ์  ๋ถ„์„ ํ•„์š”

๋ฏธ๋ž˜ ์—ฐ๊ตฌ ๋ฐฉํ–ฅ:
๋ณด๋‹ค ๋ฏธ๋ฌ˜ํ•œ ํ™˜๊ฐ ๋ถ„๋ฅ˜ ์ฒด๊ณ„์™€ ์—ฐ์†์  ํ™˜๊ฐ ์ธก์ • ๋ฐฉ๋ฒ• ๊ฐœ๋ฐœ์˜ ํ•„์š”์„ฑ์„ ์‹œ์‚ฌํ•ฉ๋‹ˆ๋‹ค.

3. ๊ฒ€์ƒ‰๊ณผ ์ถ”๋ก ์˜ ํ•œ๊ณ„ - ๋งŒ๋ณ‘ํ†ต์น˜์•ฝ์ด ์•„๋‹˜

RAG (Retrieval-Augmented Generation)์˜ ์„ฑ๊ณผ์™€ ํ•œ๊ณ„

๊ธฐ์กด ์—ฐ๊ตฌ๋“ค์˜ ์„ฑ๊ณผ:
๋‹ค์ˆ˜์˜ ์—ฐ๊ตฌ๋“ค์ด ๊ฒ€์ƒ‰ ์ฆ๊ฐ•์ด ํ™˜๊ฐ์„ ์ค„์ธ๋‹ค๋Š” ๊ฒƒ์„ ์ž…์ฆ:

  • Lewis et al. (2020): ์ง€์‹ ์ง‘์•ฝ์  NLP ์ž‘์—…์—์„œ์˜ RAG
  • Shuster et al. (2021): ๋Œ€ํ™”์—์„œ์˜ ๊ฒ€์ƒ‰ ์ฆ๊ฐ•
  • Nakano et al. (2021): WebGPT - ๋ธŒ๋ผ์šฐ์ € ์ง€์› ์งˆ๋ฌธ ๋‹ต๋ณ€
  • Zhang and Zhang (2025): RAG ์‹œ์Šคํ…œ์— ๋Œ€ํ•œ ์ตœ์‹  ์ข…ํ•ฉ ๊ฒ€ํ† 

๊ตฌ์กฐ์  ํ•œ๊ณ„์˜ ์ง€์†

Observation 1์˜ ์ผ๋ฐ˜์  ์ ์šฉ:
์ €์ž๋“ค์˜ ํ•ต์‹ฌ ํ†ต์ฐฐ: Observation 1์ด RAG๋ฅผ ํฌํ•จํ•œ ์ž„์˜์˜ ์–ธ์–ด ๋ชจ๋ธ์— ์ ์šฉ๋ฉ๋‹ˆ๋‹ค.

๊ตฌ์ฒด์  ๋ฌธ์ œ์ ๋“ค:

  1. ๊ฒ€์ƒ‰ ์‹คํŒจ ์‹œ์˜ ์ถ”์ธก ์••๋ ฅ:
  • ๊ฒ€์ƒ‰์ด ํ™•์‹  ์žˆ๋Š” ๋‹ต๋ณ€์„ ์ œ๊ณตํ•˜์ง€ ๋ชปํ•  ๋•Œ
  • ์ด์ง„ ์ฑ„์  ์‹œ์Šคํ…œ์ด ์—ฌ์ „ํžˆ ์ถ”์ธก์„ ๋ณด์ƒ
  1. ๋‚ด์žฌ์  ํ™˜๊ฐ์— ๋Œ€ํ•œ ๋ฌด๋ ฅํ•จ:

    • ๋ฌธ์ž ์„ธ๊ธฐ ์˜ˆ์‹œ: โ€œDEEPSEEK์— D๊ฐ€ ๋ช‡ ๊ฐœ?โ€
    • ์ด๋Š” ์™ธ๋ถ€ ๊ฒ€์ƒ‰์œผ๋กœ ํ•ด๊ฒฐํ•  ์ˆ˜ ์—†๋Š” ๋‚ด์žฌ์  ์ถ”๋ก  ๋Šฅ๋ ฅ์˜ ๋ฌธ์ œ
    • ํ† ํฐํ™” ๋ฐฉ์‹ (D/EEP/SEE/K)๊ณผ ๊ฐ™์€ ๋ชจ๋ธ ๊ตฌ์กฐ์  ํ•œ๊ณ„
  2. ๊ณ„์‚ฐ์  ์˜ค๋ฅ˜๋“ค:

    • ์ˆ˜ํ•™์  ๊ณ„์‚ฐ์ด๋‚˜ ๋…ผ๋ฆฌ์  ์ถ”๋ก ์—์„œ์˜ ์‹ค์ˆ˜
    • ๊ฒ€์ƒ‰์œผ๋กœ๋Š” ํ•ด๊ฒฐ๋˜์ง€ ์•Š๋Š” ์ถ”๋ก  ๊ณผ์ •์˜ ์˜ค๋ฅ˜

4. ์ž ์žฌ์  ๋งฅ๋ฝ - ์ˆจ๊ฒจ์ง„ ์ •๋ณด์˜ ๋ฌธ์ œ

ํ˜„์žฌ ์˜ค๋ฅ˜ ์ •์˜์˜ ํ•œ๊ณ„

ํ”„๋กฌํ”„ํŠธ-์‘๋‹ต ์Œ๋งŒ์œผ๋กœ๋Š” ํŒ๋‹จ ๋ถˆ๊ฐ€๋Šฅํ•œ ์˜ค๋ฅ˜๋“ค:
๊ตฌ์ฒด์  ์˜ˆ์‹œ:

์‚ฌ์šฉ์ž ์งˆ๋ฌธ: โ€œ์ „ํ™”์— ๋Œ€ํ•ด ์งˆ๋ฌธ์ด ์žˆ์Šต๋‹ˆ๋‹คโ€
๋ชจ๋ธ ์‘๋‹ต: ํœด๋Œ€ํฐ์— ๋Œ€ํ•œ ๋‹ต๋ณ€ ์ œ๊ณต
์‹ค์ œ ์˜๋„: ์œ ์„ ์ „ํ™”์— ๋Œ€ํ•œ ์งˆ๋ฌธ์ด์—ˆ์Œ

์ด๋Ÿฌํ•œ ๋ชจํ˜ธ์„ฑ์€ ํ”„๋กฌํ”„ํŠธ์™€ ์‘๋‹ต ์™ธ๋ถ€์˜ ๋งฅ๋ฝ์— ์˜์กดํ•˜๋ฏ€๋กœ ํ˜„์žฌ ์˜ค๋ฅ˜ ์ •์˜์— ๋งž์ง€ ์•Š์Šต๋‹ˆ๋‹ค.

ํ™•์žฅ ๊ฐ€๋Šฅ์„ฑ - ์ˆจ๊ฒจ์ง„ ๋งฅ๋ฝ ๋ชจ๋ธ

์ œ์•ˆ๋˜๋Š” ํ™•์žฅ:

  • ์–ธ์–ด ๋ชจ๋ธ์—๊ฒŒ ์ฃผ์–ด์ง€์ง€ ์•Š์€ โ€œ์ˆจ๊ฒจ์ง„ ๋งฅ๋ฝโ€ ํฌํ•จ
  • ์˜ค๋ฅ˜ ํŒ๋‹จ์—๋Š” ์‚ฌ์šฉ๋˜์ง€๋งŒ ๋ชจ๋ธ ์ž…๋ ฅ์—๋Š” ํฌํ•จ๋˜์ง€ ์•Š๋Š” ์ •๋ณด
  • Aleatoric uncertainty (์šฐ์—ฐ์  ๋ถˆํ™•์‹ค์„ฑ)๊ณผ์˜ ์—ฐ๊ฒฐ

์ด๋ก ์  ๋„์ „:
์ด๋Š” ํ˜„์žฌ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ƒ๋‹นํžˆ ๋ณต์žกํ•˜๊ฒŒ ๋งŒ๋“ค์ง€๋งŒ, ๋” ํ˜„์‹ค์ ์ธ ํ™˜๊ฐ ๋ชจ๋ธ๋ง์„ ์œ„ํ•ด์„œ๋Š” ํฅ๋ฏธ๋กœ์šด ํ™•์žฅ ๋ฐฉํ–ฅ์ž…๋‹ˆ๋‹ค.

5. ์ž˜๋ชป๋œ ์‚ผ๋ถ„๋ฒ• - ๋‹จ์ˆœํ™”์˜ ํ•œ๊ณ„

ํ˜„์žฌ ๋ถ„๋ฅ˜ ์ฒด๊ณ„์˜ ๋ถ€์กฑํ•จ

์ •ํ™•/๋ถ€์ •ํ™•/IDK ๋ฒ”์ฃผ์˜ ํ•œ๊ณ„:
์ €์ž๋“ค์€ ์ž์‹ ๋“ค์˜ ํ”„๋ ˆ์ž„์›Œํฌ๋„ ๋ถˆ์™„์ „ํ•จ์„ ์†”์งํ•˜๊ฒŒ ์ธ์ •ํ•ฉ๋‹ˆ๋‹ค:

  • ์˜ค๋ฅ˜์˜ ๋‹ค์–‘ํ•œ ๊ทœ๋ชจ: ์‚ฌ์†Œํ•œ ์‹ค์ˆ˜์™€ ์‹ฌ๊ฐํ•œ ์˜ค๋ฅ˜๋ฅผ ๊ตฌ๋ถ„ํ•˜์ง€ ์•Š์Œ
  • ๋ถˆํ™•์‹ค์„ฑ์˜ ์ •๋„: โ€œ์•ฝ๊ฐ„ ๋ถˆํ™•์‹คโ€๊ณผ โ€œ์™„์ „ํžˆ ๋ชจ๋ฆ„โ€ ์‚ฌ์ด์˜ ์ฐจ์ด๋ฅผ ๋ฐ˜์˜ํ•˜์ง€ ๋ชปํ•จ
  • ๋งฅ๋ฝ ์˜์กด์  ์ ์ ˆ์„ฑ: ์ƒํ™ฉ์— ๋”ฐ๋ผ ๋‹ค๋ฅธ ์‘๋‹ต์ด ์ ์ ˆํ•  ์ˆ˜ ์žˆ์Œ

ํ†ต๊ณ„์  ์ด์ƒ๊ณผ ์‹ค์šฉ์  ์ ˆ์ถฉ

์ด๋ก ์  ์ด์ƒํ–ฅ:

  • ๊ฐ ํ‰๊ฐ€๋ฅผ ๋‹ค์šด์ŠคํŠธ๋ฆผ ์‘์šฉ์—์„œ์™€ ์ •ํ™•ํžˆ ๊ฐ™์€ ๋ฐฉ์‹์œผ๋กœ ์ฑ„์ ํ•˜๋Š” ๊ฒƒ
  • ํ•˜์ง€๋งŒ ์ด๋Š” ์‘์šฉ๋งˆ๋‹ค ๋‹ค๋ฅธ ์ฑ„์  ๊ธฐ์ค€์„ ์š”๊ตฌํ•˜๋ฏ€๋กœ ํ‘œ์ค€ํ™” ์–ด๋ ค์›€

์‹ค์šฉ์  ์ ˆ์ถฉ์•ˆ:

  • ๋ช…์‹œ์  ์‹ ๋ขฐ๋„ ๋ชฉํ‘œ: ์ ์–ด๋„ IDK ์˜ต์…˜์„ ์ œ๊ณตํ•˜๋Š” ์‹ค์šฉ์ ์ด๊ณ  ๊ฐ๊ด€์ ์ธ ์ˆ˜์ •
  • ์ž˜๋ชป๋œ ์‚ผ๋ถ„๋ฒ• vs ์ž˜๋ชป๋œ ์ด๋ถ„๋ฒ•: ๋ถˆ์™„์ „ํ•˜๋”๋ผ๋„ ์ด๋ถ„๋ฒ•๋ณด๋‹ค๋Š” ๊ฐœ์„ ๋œ ์ ‘๊ทผ

6. IDK๋ฅผ ๋„˜์–ด์„œ - ๋ถˆํ™•์‹ค์„ฑ ํ‘œํ˜„์˜ ๋‹ค์–‘์„ฑ

๋‹ค์–‘ํ•œ ๋ถˆํ™•์‹ค์„ฑ ์‹ ํ˜ธ ๋ฐฉ๋ฒ•๋“ค

์–ธ์–ด์  ๋ถˆํ™•์‹ค์„ฑ ํ‘œํ˜„์˜ ์ŠคํŽ™ํŠธ๋Ÿผ:

  1. ํ—ค์ง• (Hedging): โ€œ์•„๋งˆ๋„โ€, โ€œ~์ธ ๊ฒƒ ๊ฐ™์Šต๋‹ˆ๋‹คโ€, โ€œํ™•์‹คํ•˜์ง€๋Š” ์•Š์ง€๋งŒโ€
  2. ์„ธ๋ถ€์‚ฌํ•ญ ์ƒ๋žต: ํ™•์‹คํ•œ ์ผ๋ฐ˜์  ์ •๋ณด๋Š” ์ œ๊ณตํ•˜๋˜, ๋ถˆํ™•์‹คํ•œ ๊ตฌ์ฒด์  ์„ธ๋ถ€์‚ฌํ•ญ์€ ์ƒ๋žต
  3. ์งˆ๋ฌธํ•˜๊ธฐ: โ€œ์–ด๋–ค ์ข…๋ฅ˜์˜ ~์„ ๋ง์”€ํ•˜์‹œ๋Š” ๊ฑด๊ฐ€์š”?โ€
  4. ์กฐ๊ฑด๋ถ€ ์‘๋‹ต: โ€œ๋งŒ์•ฝ ~์„ ์˜๋ฏธํ•˜์‹ ๋‹ค๋ฉดโ€ฆโ€

์–ธ์–ด์  ๋ณด์ • (Linguistic Calibration)์˜ ๊ฐ€๋Šฅ์„ฑ

๋ฏธ๋ž˜ ์—ฐ๊ตฌ ๋ฐฉํ–ฅ:

  • Mielke et al. (2022), Damani et al. (2025)์˜ ์—ฐ๊ตฌ์—์„œ ์ œ์‹œ๋œ ์ ์ง„์  ๋ถˆํ™•์‹ค์„ฑ ํ‘œํ˜„
  • ๋‹จ์ˆœํ•œ ํ™•๋ฅ  ์ˆ˜์น˜๊ฐ€ ์•„๋‹Œ ์ž์—ฐ์Šค๋Ÿฌ์šด ์–ธ์–ด๋ฅผ ํ†ตํ•œ ์‹ ๋ขฐ๋„ ์ „๋‹ฌ

ํ™”์šฉ๋ก ์  ํ˜„์ƒ์˜ ๋ฏธ๋ฌ˜ํ•จ:
Austin (1962), Grice (1975)์˜ ํ™”์šฉ๋ก  ์—ฐ๊ตฌ์—์„œ ๋“œ๋Ÿฌ๋‚˜๋Š” ์–ธ์–ด์˜ ๋ณต์žก์„ฑ:

  • ๋งฅ๋ฝ์ด ์˜๋ฏธ๋ฅผ ํ˜•์„ฑํ•˜๋Š” ๋ฐฉ์‹
  • ๋ช…์‹œ์  ๋‚ด์šฉ๊ณผ ์•”์‹œ์  ์˜๋ฏธ ๊ฐ„์˜ ์ฐจ์ด

ํ™•๋ฅ ์  ์‹ ๋ขฐ๋„ ์ง„์ˆ ์˜ ๋ฌธ์ œ์ 

๋ถ€์ž์—ฐ์Šค๋Ÿฌ์šด ๋ฐœํ™”์˜ ์˜ˆ:

โ€œ์นผ๋ผ์ด์˜ ์ƒ์ผ์ด 3์›” 7์ผ์ผ ํ™•๋ฅ ์€ 1/365์ž…๋‹ˆ๋‹ค.โ€

์ด๋Ÿฐ ํ‘œํ˜„์€ ๊ธฐ์ˆ ์ ์œผ๋กœ๋Š” ์ •ํ™•ํ•˜์ง€๋งŒ ์ž์—ฐ์Šค๋Ÿฌ์šด ๋Œ€ํ™”์—์„œ๋Š” ์–ด์ƒ‰ํ•ฉ๋‹ˆ๋‹ค.

๋ณธ ๋…ผ๋ฌธ์˜ ์ง‘์ค‘์ :
์ €์ž๋“ค์€ โ€œ๋ฌด์—‡์„ ๋งํ•  ๊ฒƒ์ธ๊ฐ€โ€๋ผ๋Š” ์ตœ์ƒ์œ„ ๊ฒฐ์ •์— ๋Œ€ํ•œ ํ†ต๊ณ„์  ์š”์ธ์— ์ง‘์ค‘ํ•˜๋ฉฐ, ๋” ๋ฏธ๋ฌ˜ํ•œ ํ™”์šฉ๋ก ์  ํ‘œํ˜„์€ ๋ฏธ๋ž˜ ์—ฐ๊ตฌ ๊ณผ์ œ๋กœ ๋‚จ๊ฒจ๋‘ก๋‹ˆ๋‹ค.


๐Ÿ“– Chapter 6: Conclusions - ์—ฐ๊ตฌ ์„ฑ๊ณผ์˜ ์ข…ํ•ฉ๊ณผ ์ „๋ง

๊ฒฐ๋ก  ์žฅ์€ ์ „์ฒด ์—ฐ๊ตฌ์˜ ํ•ต์‹ฌ ์„ฑ๊ณผ๋ฅผ ๊ฐ„๊ฒฐํ•˜๊ฒŒ ์š”์•ฝํ•˜๊ณ , ์–ธ์–ด ๋ชจ๋ธ ๊ฐœ๋ฐœ๊ณผ ํ‰๊ฐ€์— ๋ฏธ์น  ์žฅ๊ธฐ์  ์˜ํ–ฅ์„ ์ „๋งํ•ฉ๋‹ˆ๋‹ค.
๋‹จ์ˆœํ•œ ์š”์•ฝ์„ ๋„˜์–ด์„œ ์—ฐ๊ตฌ์˜ ์‹ค์šฉ์  ํ•จ์˜์™€ ๋ถ„์•ผ ์ „์ฒด์˜ ๋ฐฉํ–ฅ ์ „ํ™˜ ๊ฐ€๋Šฅ์„ฑ์„ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.

์ฑ•ํ„ฐ์˜ ํ•ต์‹ฌ ๊ธฐ์—ฌ

  1. ํ†ตํ•ฉ์  ์„ฑ๊ณผ ์š”์•ฝ: ์ด๋ก ์  ๊ธฐ์—ฌ์™€ ์‹ค์šฉ์  ํ•ด๊ฒฐ์ฑ…์„ ๊ท ํ˜•์žˆ๊ฒŒ ์ •๋ฆฌ
  2. ์‹คํ˜„ ๊ฐ€๋Šฅ์„ฑ ๊ฐ•์กฐ: ๋‹จ์ˆœํ•œ ์ˆ˜์ •์„ ํ†ตํ•œ ํฐ ๋ณ€ํ™”์˜ ๊ฐ€๋Šฅ์„ฑ ์ œ์‹œ
  3. ๋ฏธ๋ž˜ ๋น„์ „ ์ œ์‹œ: ๋” ์‹ ๋ขฐํ•  ์ˆ˜ ์žˆ๋Š” AI ์‹œ์Šคํ…œ์œผ๋กœ์˜ ๋ฐœ์ „ ๋ฐฉํ–ฅ ์ œ์‹œ
  4. ํ–‰๋™ ์ด‰๊ตฌ: ์—ฐ๊ตฌ ์ปค๋ฎค๋‹ˆํ‹ฐ์˜ ๊ตฌ์ฒด์  ํ–‰๋™ ๋ฐฉ์•ˆ ์ œ์‹œ

1. ํ™˜๊ฐ ํ˜„์ƒ์˜ ์™„์ „ํ•œ ํƒˆ์‹ ๋น„ํ™”

์‚ฌ์ „ํ›ˆ๋ จ์—์„œ ํ›„ํ›ˆ๋ จ๊นŒ์ง€์˜ ํ†ตํ•ฉ์  ์ดํ•ด

์ด๋ก ์  ๊ธฐ์—ฌ์˜ ํ•ต์‹ฌ:

  • ์‚ฌ์ „ํ›ˆ๋ จ ๋‹จ๊ณ„: ํ™˜๊ฐ์ด ๋ฐœ์ƒํ•˜๋Š” ํ†ต๊ณ„์  ๋ฉ”์ปค๋‹ˆ์ฆ˜์˜ ์ˆ˜ํ•™์  ๊ทœ๋ช…
  • ํ›„ํ›ˆ๋ จ ๋‹จ๊ณ„: ํ™˜๊ฐ์ด ์ง€์†๋˜๋Š” ์‚ฌํšŒ๊ธฐ์ˆ ์  ์›์ธ์˜ ์ฒด๊ณ„์  ๋ถ„์„
  • ์ „์ฒด ํŒŒ์ดํ”„๋ผ์ธ: ํ˜„๋Œ€ ํ›ˆ๋ จ ๊ณผ์ • ์ „๋ฐ˜์— ๊ฑธ์นœ ์™„์ „ํ•œ ์ดํ•ด ์ œ๊ณต

์ง€๋„ํ•™์Šต๊ณผ์˜ ํ‰ํ–‰ ๊ด€๊ณ„ ํ™•๋ฆฝ

ํ•ต์‹ฌ ํ†ต์ฐฐ์˜ ์žฌ๊ฐ•์กฐ:

  • ์‚ฌ์ „ํ›ˆ๋ จ์—์„œ ์ƒ์„ฑ ์˜ค๋ฅ˜๊ฐ€ ์ง€๋„ํ•™์Šต์˜ ์˜ค๋ถ„๋ฅ˜์™€ ํ‰ํ–‰๊ด€๊ณ„์— ์žˆ์Œ์„ ์ฆ๋ช…
  • ์ด๋Š” ์‹ ๋น„๋กœ์šด ํ˜„์ƒ์ด ์•„๋‹˜์„ ์˜๋ฏธ
  • ์ˆ˜์‹ญ ๋…„๊ฐ„ ์ถ•์ ๋œ ๋ถ„๋ฅ˜ ์˜ค๋ฅ˜ ์ด๋ก ์„ ํ™˜๊ฐ ๋ถ„์„์— ์ง์ ‘ ํ™œ์šฉ ๊ฐ€๋Šฅ

๊ต์ฐจ ์—”ํŠธ๋กœํ”ผ ์†์‹ค ์ตœ์†Œํ™”์˜ ์ž์—ฐ์Šค๋Ÿฌ์šด ๊ฒฐ๊ณผ:

  • ํ™˜๊ฐ์ด ๋ชจ๋ธ์˜ ๊ฒฐํ•จ์ด๋‚˜ ์‹ค์ˆ˜๊ฐ€ ์•„๋‹Œ, ํ‘œ์ค€ ํ›ˆ๋ จ ๋ชฉ์ ํ•จ์ˆ˜์˜ ์ž์—ฐ์Šค๋Ÿฌ์šด ๊ฒฐ๊ณผ์ž„์„ ์ž…์ฆ
  • ์ด๋Š” ํ™˜๊ฐ์„ โ€œ๊ณ ์น  ์ˆ˜ ์žˆ๋Š” ๋ฒ„๊ทธโ€๊ฐ€ ์•„๋‹Œ โ€œ์ดํ•ดํ•˜๊ณ  ๊ด€๋ฆฌํ•ด์•ผ ํ•  ํŠน์„ฑโ€์œผ๋กœ ์žฌ์ •์˜

2. ํ‰๊ฐ€ ๋ฐฉ์‹์˜ ๊ทผ๋ณธ์  ๋ฌธ์ œ ์ง€์ 

๋‹จ์ผ ํ‰๊ฐ€ vs ๊ตฌ์กฐ์  ๋ฌธ์ œ์˜ ๋Œ€๋น„

โ€œCertainlyโ€ ํ‰๊ฐ€์™€์˜ ๋Œ€์กฐ:
์ €์ž๋“ค์ด ์ œ์‹œํ•˜๋Š” ์ค‘์š”ํ•œ ๊ตฌ๋ถ„:

  • ๋‹จ์ผ ๋ฌธ์ œ: โ€œCertainlyโ€๋กœ ์‘๋‹ต์„ ์‹œ์ž‘ํ•˜๋Š” ์Šต๊ด€ ๊ฐ™์€ ๊ฒฝ์šฐ
    • ๋‹จ์ผ โ€œCertainlyโ€ ํ‰๊ฐ€๋กœ ํ•ด๊ฒฐ ๊ฐ€๋Šฅ
    • ๋‹ค๋ฅธ ํ‰๊ฐ€๋“ค์— ์˜ํ–ฅ์„ ์ฃผ์ง€ ์•Š์Œ
  • ๊ตฌ์กฐ์  ๋ฌธ์ œ: ํ™˜๊ฐ์€ ๋Œ€๋‹ค์ˆ˜ ์ฃผ๋ฅ˜ ํ‰๊ฐ€๋“ค์ด ํ™˜๊ฐ์  ํ–‰๋™์„ ๋ณด์ƒํ•˜๋Š” ๊ตฌ์กฐ

์••๋„์  ๊ทœ๋ชจ์˜ ๋ฌธ์ œ

์ˆ˜์น˜์  ์••๋„:

  • Table 2์—์„œ ๋ณด์ธ ๋ฐ”์™€ ๊ฐ™์ด ์ฃผ์š” ๋ฒค์น˜๋งˆํฌ๋“ค์˜ ์••๋„์  ๋‹ค์ˆ˜๊ฐ€ ์ด์ง„ ์ฑ„์ 
  • ์†Œ์ˆ˜์˜ ํ™˜๊ฐ ์ „์šฉ ํ‰๊ฐ€๋กœ๋Š” ์ด๋Ÿฌํ•œ ๊ตฌ์กฐ์  ๋ถˆ๊ท ํ˜• ํ•ด๊ฒฐ ๋ถˆ๊ฐ€๋Šฅ
  • ํ™˜๊ฐ ์—ฐ๊ตฌ์ž๋“ค์ด โ€œ์™„๋ฒฝํ•œ ํ™˜๊ฐ ํ‰๊ฐ€โ€ ์ถ”๊ตฌ์—๋งŒ ์ง‘์ค‘ํ•˜๋Š” ๊ฒƒ์˜ ํ•œ๊ณ„

๊ทผ๋ณธ์  ํ•ด๊ฒฐ์ฑ…์˜ ํ•„์š”์„ฑ:
๊ฐœ๋ณ„ ํ™˜๊ฐ ํ‰๊ฐ€ ์ถ”๊ฐ€๊ฐ€ ์•„๋‹Œ, ์ฃผ๋ฅ˜ ํ‰๊ฐ€๋“ค ์ž์ฒด์˜ ์ˆ˜์ •์ด ํ•„์ˆ˜์ ์ž…๋‹ˆ๋‹ค.

3. ์‹ค์šฉ์  ํ•ด๊ฒฐ์ฑ…์˜ ์‹คํ˜„ ๊ฐ€๋Šฅ์„ฑ

์ฃผ๋ฅ˜ ํ‰๊ฐ€์˜ ๋‹จ์ˆœํ•œ ์ˆ˜์ •

์ตœ์†Œํ•œ์˜ ๋ณ€ํ™”๋กœ ์ตœ๋Œ€ํ•œ์˜ ํšจ๊ณผ:

  • ๊ธฐ์กด ๋ฒค์น˜๋งˆํฌ์˜ ์ง€์‹œ์‚ฌํ•ญ ์ˆ˜์ •๋งŒ์œผ๋กœ๋„ ํฐ ๋ณ€ํ™” ๊ฐ€๋Šฅ
  • ์ƒˆ๋กœ์šด ํ‰๊ฐ€ ๊ฐœ๋ฐœ์ด๋‚˜ ๋ณต์žกํ•œ ์•Œ๊ณ ๋ฆฌ์ฆ˜ ๋ถˆํ•„์š”
  • โ€œt ์ด์ƒ ํ™•์‹ ํ•  ๋•Œ๋งŒ ๋‹ตํ•˜์‹œ์˜คโ€ ๊ฐ™์€ ๊ฐ„๋‹จํ•œ ๋ฌธ๊ตฌ ์ถ”๊ฐ€

์ธ์„ผํ‹ฐ๋ธŒ ์žฌ์ •๋ ฌ์˜ ๋ฉ”์ปค๋‹ˆ์ฆ˜:

  • ์ ์ ˆํ•œ ๋ถˆํ™•์‹ค์„ฑ ํ‘œํ˜„์„ ์ฒ˜๋ฒŒํ•˜๋Š” ๋Œ€์‹  ๋ณด์ƒํ•˜๋Š” ๊ตฌ์กฐ๋กœ ์ „ํ™˜
  • ์ด๋Š” Model A (์ •๋ ฌ๋œ ๋ชจ๋ธ)๊ฐ€ Model B (์ถ”์ธก ๋ชจ๋ธ)๋ณด๋‹ค ์šฐ์ˆ˜ํ•œ ์„ฑ๊ณผ๋ฅผ ๋‚ด๋„๋ก ํ•จ
  • ์ˆ˜ํ•™์ ์œผ๋กœ ์ตœ์ ํ™”๋œ ์‹ ๋ขฐ๋„ ์ž„๊ณ„๊ฐ’ ์„ค์ •์„ ํ†ตํ•œ ๊ฐ๊ด€์  ํ‰๊ฐ€

4. ํ–ฅํ›„ ์—ฐ๊ตฌ ๋ฐฉํ–ฅ์˜ ์ƒˆ๋กœ์šด ์ง€ํ‰

ํ™˜๊ฐ ์–ต์ œ ์žฅ๋ฒฝ์˜ ์ œ๊ฑฐ

ํ˜„์žฌ ์ƒํ™ฉ์˜ ๋ณ€ํ™”:

  • ๊ธฐ์กด: ํ›„ํ›ˆ๋ จ ์•Œ๊ณ ๋ฆฌ์ฆ˜ ๊ฐœ๋ฐœ์—๋„ ๋ถˆ๊ตฌํ•˜๊ณ  ํ™˜๊ฐ ์ง€์†
  • ๋ณ€ํ™” ํ›„: ํ‰๊ฐ€ ๋ฐฉ์‹ ์ˆ˜์ •์„ ํ†ตํ•œ ๊ตฌ์กฐ์  ์žฅ๋ฒฝ ์ œ๊ฑฐ
  • ๊ฒฐ๊ณผ: ๊ธฐ์กด ๋ฐ ๋ฏธ๋ž˜์˜ ํ™˜๊ฐ ์™„ํ™” ๊ธฐ๋ฒ•๋“ค์˜ ํšจ๊ณผ์„ฑ ์ฆ๋Œ€

๋ฏธ๋ฌ˜ํ•œ ์–ธ์–ด ๋ชจ๋ธ์˜ ๊ฐ€๋Šฅ์„ฑ

๋” ํ’๋ถ€ํ•œ ํ™”์šฉ๋ก ์  ๋Šฅ๋ ฅ:
Ma et al. (2025)์˜ ํ™”์šฉ๋ก  ์—ฐ๊ตฌ์™€ ์—ฐ๊ฒฐํ•˜์—ฌ:

  • ๋งฅ๋ฝ์— ๋”ฐ๋ฅธ ์ ์ ˆํ•œ ๋ถˆํ™•์‹ค์„ฑ ํ‘œํ˜„
  • ์ž์—ฐ์Šค๋Ÿฌ์šด ์–ธ์–ด๋ฅผ ํ†ตํ•œ ์‹ ๋ขฐ๋„ ์ „๋‹ฌ
  • ์‚ฌ์šฉ์ž์™€์˜ ๋” ํšจ๊ณผ์ ์ธ ์†Œํ†ต

์–ธ์–ด์  ๋ณด์ • (Linguistic Calibration):

  • ํ™•๋ฅ  ์ˆ˜์น˜๊ฐ€ ์•„๋‹Œ ์ž์—ฐ์Šค๋Ÿฌ์šด ์–ธ์–ด ํ‘œํ˜„์„ ํ†ตํ•œ ๋ถˆํ™•์‹ค์„ฑ ์ „๋‹ฌ
  • ํ™”์šฉ๋ก ์  ๋งฅ๋ฝ์„ ๊ณ ๋ คํ•œ ์ ์ ˆํ•œ ์‘๋‹ต ์ƒ์„ฑ

5. ๋ถ„์•ผ ์ „์ฒด์˜ ํŒจ๋Ÿฌ๋‹ค์ž„ ์ „ํ™˜

๋ฆฌ๋”๋ณด๋“œ์™€ ๋ฒค์น˜๋งˆํฌ ์ƒํƒœ๊ณ„์˜ ๋ณ€ํ™”

์ ์ง„์  ๋ณ€ํ™”์˜ ์ „๋žต:

  • ๊ฐœ๋ณ„ ์—ฐ๊ตฌ์ž๋‚˜ ๊ธฐ๊ด€์˜ ๋…ธ๋ ฅ๋งŒ์œผ๋กœ๋Š” ํ•œ๊ณ„
  • ์‚ฌํšŒ๊ธฐ์ˆ ์  ํ•ฉ์˜๋ฅผ ํ†ตํ•œ ๋ถ„์•ผ ์ „์ฒด์˜ ๋ฐฉํ–ฅ ์ „ํ™˜ ํ•„์š”
  • ์˜ํ–ฅ๋ ฅ ์žˆ๋Š” ๋ฆฌ๋”๋ณด๋“œ๋“ค์˜ ์ฑ„ํƒ์ด ํ•ต์‹ฌ

๋ณ€ํ™”์˜ ์—ฐ์‡„ ๋ฐ˜์‘:

  1. ์ฃผ์š” ๋ฆฌ๋”๋ณด๋“œ์—์„œ ๋ช…์‹œ์  ์‹ ๋ขฐ๋„ ๋ชฉํ‘œ ์ฑ„ํƒ
  2. ๋ชจ๋ธ ๊ฐœ๋ฐœ์ž๋“ค์ด ์ƒˆ๋กœ์šด ํ‰๊ฐ€ ๊ธฐ์ค€์— ๋งž์ถฐ ์ตœ์ ํ™”
  3. ๋” ์‹ ๋ขฐํ•  ์ˆ˜ ์žˆ๋Š” ๋ชจ๋ธ๋“ค์ด ๊ฒฝ์Ÿ์—์„œ ์šฐ์œ„
  4. ์‚ฌ์šฉ์ž๋“ค์ด ๋” ๋‚˜์€ ๊ฒฝํ—˜์„ ํ•˜๊ฒŒ ๋จ

๋” ์‹ ๋ขฐํ•  ์ˆ˜ ์žˆ๋Š” AI ์‹œ์Šคํ…œ์œผ๋กœ์˜ ์ „ํ™˜

์‚ฌํšŒ์  ์˜ํ–ฅ:

  • ์˜๋ฃŒ, ๋ฒ•๋ฅ , ๊ธˆ์œต ๋“ฑ ๊ณ ์œ„ํ—˜ ๋„๋ฉ”์ธ์—์„œ์˜ AI ์‹ ๋ขฐ์„ฑ ํ–ฅ์ƒ
  • ์ผ๋ฐ˜ ์‚ฌ์šฉ์ž๋“ค์˜ AI์— ๋Œ€ํ•œ ์‹ ๋ขฐ๋„ ์ฆ๊ฐ€
  • AI ์•ˆ์ „์„ฑ์— ๋Œ€ํ•œ ์‚ฌํšŒ์  ์šฐ๋ ค ์™„ํ™”

๊ธฐ์ˆ ์  ๋ฐœ์ „:

  • ๋ถˆํ™•์‹ค์„ฑ์„ ์ ์ ˆํžˆ ์ฒ˜๋ฆฌํ•˜๋Š” ๋ชจ๋ธ ๊ฐœ๋ฐœ ์ด‰์ง„
  • ํ–‰๋™ ๋ณด์ • ๊ฐ™์€ ์ƒˆ๋กœ์šด ํ‰๊ฐ€ ํŒจ๋Ÿฌ๋‹ค์ž„ ํ™•์‚ฐ
  • ํ™˜๊ฐ ์™„ํ™” ๊ธฐ์ˆ ๋“ค์˜ ํšจ๊ณผ์„ฑ ์ฆ๋Œ€

๊ฒฐ๋ก ์€ ํ™˜๊ฐ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•œ โ€œ์€ํƒ„ํ™˜โ€์„ ์ฐพ๋Š” ๋Œ€์‹ , ์‹œ์Šคํ…œ์  ์ ‘๊ทผ์„ ํ†ตํ•œ ์ ์ง„์ ์ด์ง€๋งŒ ๊ทผ๋ณธ์ ์ธ ๊ฐœ์„ ์ด ๊ฐ€๋Šฅํ•จ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค. ์ด๋Š” ๋‹จ์ˆœํžˆ ๊ธฐ์ˆ ์  ํ•ด๊ฒฐ์ฑ…์ด ์•„๋‹Œ, ์‚ฌํšŒ๊ธฐ์ˆ ์  ํ•ฉ์˜๋ฅผ ํ†ตํ•œ ๋ถ„์•ผ ์ „์ฒด์˜ ๋ฐœ์ „์„ ์ถ”๊ตฌํ•˜๋Š” ์„ฑ์ˆ™ํ•œ ์—ฐ๊ตฌ ์ ‘๊ทผ๋ฒ•์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.

์ฝ์–ด์ฃผ์…”์„œ ๊ฐ์‚ฌํ•ฉ๋‹ˆ๋‹ค ๐Ÿ˜ธ



-->