[Paper Review] ํ•ฉ์„ฑ ๋ฐ์ดํ„ฐ = ๋ชจ๋ธ ๋ถ•๊ดด?

Posted by Euisuk's Dev Log on August 26, 2024

[Paper Review] ํ•ฉ์„ฑ ๋ฐ์ดํ„ฐ = ๋ชจ๋ธ ๋ถ•๊ดด?

์›๋ณธ ๊ฒŒ์‹œ๊ธ€: https://velog.io/@euisuk-chung/๋ฆฌ๋ทฐ-์ธ๊ณต-๋ฐ์ดํ„ฐ๋กœ-๋ชจ๋ธ์„-ํ•™์Šตํ•˜๋ฉด-๋ชจ๋ธ-๋ถ•๊ดด๊ฐ€-์ผ์–ด๋‚œ๋‹ค๊ณ 

๋“ค์–ด๊ฐ€๋ฉฐ

์ตœ๊ทผ ์ธ๊ณต์ง€๋Šฅ(AI) ๋ถ„์•ผ์—์„œ ๋งค์šฐ ํฅ๋ฏธ๋กœ์šด ๋‘ ๋…ผ๋ฌธ์ด Nature์— ๊ฒŒ์žฌ๋˜์–ด ํฐ ํ™”์ œ๋ฅผ ๋ชจ์œผ๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ์•„๋ž˜ ๋‘ ๋…ผ๋ฌธ์€ ๊ณตํ†ต์ ์œผ๋กœ AI ๋ชจ๋ธ์˜ ๋ฐœ์ „๊ณผ ๊ด€๋ จ๋œ ์ค‘๋Œ€ํ•œ ๋ฌธ์ œ๋ฅผ ๋‹ค๋ฃจ๊ณ  ์žˆ์œผ๋ฉฐ, AI ๊ธฐ์ˆ ์˜ ์žฅ๊ธฐ์ ์ธ ์œ„ํ—˜์„ฑ์„ ๊ฒฝ๊ณ ํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

  • AI models collapse when trained on recursively generated data

  • AI produces gibberish when trained on too much AI-generated data

์ €๋Š” ์ด๋ฒˆ ๋…ผ๋ฌธ์„ ๊ณ„๊ธฐ๋กœ Nature ํ•™์ˆ ์ง€์˜ ๊ฐ„๋žตํ•œ ์†Œ๊ฐœ์™€ ํ•จ๊ป˜, ์œ„ ๋‘ ๋…ผ๋ฌธ์ด ๋‹ค๋ฃจ๊ณ  ์žˆ๋Š” ์ค‘์š”ํ•œ ๋‚ด์šฉ์„ ์ž์„ธํžˆ ์ •๋ฆฌํ•ด๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค.

Nature ํ•™์ˆ ์ง€ ์†Œ๊ฐœ

๋จผ์ €, Nature์— ๋Œ€ํ•ด ๊ฐ„๋‹จํžˆ ์†Œ๊ฐœํ•˜๊ฒ ์Šต๋‹ˆ๋‹ค. Nature๋Š” 1869๋…„์— ์ฐฝ๊ฐ„๋œ ์ดํ›„๋กœ ๊ณผํ•™๊ณ„์—์„œ ๊ฐ€์žฅ ์ค‘์š”ํ•œ ํ•™์ˆ ์ง€ ์ค‘ ํ•˜๋‚˜๋กœ ์ž๋ฆฌ ์žก์•˜์Šต๋‹ˆ๋‹ค. ์ด ์ €๋„์€ ๋‹ค์–‘ํ•œ ๊ณผํ•™ ๋ถ„์•ผ์˜ ์ตœ์‹  ์—ฐ๊ตฌ ๊ฒฐ๊ณผ๋ฅผ ๋ฐœํ‘œํ•˜๋Š”๋ฐ, ๋…ผ๋ฌธ๋“ค์ด ๊ฒŒ์žฌ๋˜๊ธฐ ์œ„ํ•ด์„œ๋Š” ์—„๊ฒฉํ•œ ํ”ผ์–ด ๋ฆฌ๋ทฐ ๊ณผ์ •์„ ๊ฑฐ์ณ์•ผ ํ•ฉ๋‹ˆ๋‹ค. ๋”ฐ๋ผ์„œ Nature์— ์‹ค๋ฆฌ๋Š” ๋…ผ๋ฌธ๋“ค์€ ๊ทธ ์ž์ฒด๋กœ ๊ณผํ•™์  ์‹ ๋ขฐ์„ฑ์ด ๋†’์œผ๋ฉฐ, ํ•™๋ฌธ์  ๋ฐ ์‚ฌํšŒ์ ์œผ๋กœ ํฐ ์˜ํ–ฅ์„ ๋ฏธ์นฉ๋‹ˆ๋‹ค.

๋˜ํ•œ Nature์—๋Š” ๋‹ค์–‘ํ•œ ์œ ํ˜•์˜ ๊ธ€๋“ค์ด ๊ฒŒ์žฌ๋˜๋Š”๋ฐ, ๊ทธ ์ค‘ ๋ช‡ ๊ฐ€์ง€๋ฅผ ์†Œ๊ฐœํ•˜์ž๋ฉด:

  • Research Article: ์›๋ณธ ์—ฐ๊ตฌ ๊ฒฐ๊ณผ๋ฅผ ์ƒ์„ธํžˆ ๋ณด๊ณ ํ•˜๋Š” ์ •์‹ ํ•™์ˆ  ๋…ผ๋ฌธ์ž…๋‹ˆ๋‹ค.
  • News & Views: ์ตœ๊ทผ ๋ฐœํ‘œ๋œ ์ค‘์š” ์—ฐ๊ตฌ์— ๋Œ€ํ•œ ์ „๋ฌธ๊ฐ€์˜ ํ•ด์„ค๊ณผ ๋…ผํ‰์ž…๋‹ˆ๋‹ค.
  • Letter: ์งง๊ณ  ์ค‘์š”ํ•œ ์—ฐ๊ตฌ ๊ฒฐ๊ณผ๋ฅผ ์‹ ์†ํ•˜๊ฒŒ ๋ณด๊ณ ํ•˜๋Š” ํ˜•์‹์ž…๋‹ˆ๋‹ค.
  • Review: ํŠน์ • ์ฃผ์ œ์— ๋Œ€ํ•œ ํฌ๊ด„์ ์ธ ๊ฐœ์š”์™€ ๋ถ„์„์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
  • Perspective: ํŠน์ • ๊ณผํ•™ ๋ถ„์•ผ์˜ ํ˜„์žฌ ์ƒํƒœ์™€ ๋ฏธ๋ž˜ ๋ฐฉํ–ฅ์— ๋Œ€ํ•œ ๊ฐœ์ธ์  ๊ฒฌํ•ด๋ฅผ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.
  • Commentary: ๊ณผํ•™ ์ •์ฑ…, ์œค๋ฆฌ, ์‚ฌํšŒ์  ์ด์Šˆ ๋“ฑ์— ๋Œ€ํ•œ ์˜๊ฒฌ์„ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.
  • Editorial: ์ €๋„ ํŽธ์ง‘์ง„์˜ ์˜๊ฒฌ์ด๋‚˜ ์ค‘์š”ํ•œ ๊ณผํ•™์  ์ด์Šˆ์— ๋Œ€ํ•œ ์ž…์žฅ์„ ํ‘œ๋ช…ํ•ฉ๋‹ˆ๋‹ค.
  • Correspondence: ์ด์ „์— ์ถœํŒ๋œ ๋…ผ๋ฌธ์— ๋Œ€ํ•œ ์งง์€ ์˜๊ฒฌ์ด๋‚˜ ์ถ”๊ฐ€ ์ •๋ณด๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.

์ด๋ ‡๋“ฏ Nature๋Š” ๋‹ค์–‘ํ•œ ํ˜•์‹์˜ ๊ธ€์„ ํ†ตํ•ด ๊ณผํ•™์  ๋…ผ์˜๋ฅผ ์ด‰์ง„ํ•˜๊ณ , ๋…์ž๋“ค์ด ์ตœ์‹  ๊ณผํ•™ ์—ฐ๊ตฌ๋ฅผ ๋‹ค๊ฐ๋„๋กœ ์ดํ•ดํ•  ์ˆ˜ ์žˆ๋„๋ก ๋•๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

AI models collapse when trained on recursively generated data

(๋ฒˆ์—ญ) AI ๋ชจ๋ธ ๋ถ•๊ดด: AI ๋ชจ๋ธ์ด ์ž๊ธฐ ์ž์‹ ์„ ๋ง์น  ์ˆ˜ ์žˆ๋‹ค?

์ฒซ ๋ฒˆ์งธ ๋…ผ๋ฌธ, โ€œAI models collapse when trained on recursively generated dataโ€์—์„œ๋Š” ๋Œ€ํ˜• ์–ธ์–ด ๋ชจ๋ธ(LLM)๊ณผ ๊ฐ™์€ ์ƒ์„ฑํ˜• ์ธ๊ณต์ง€๋Šฅ์ด ๋ฐ˜๋ณต์ ์œผ๋กœ ์ž์ฒด ์ƒ์„ฑ ๋ฐ์ดํ„ฐ๋ฅผ ํ•™์Šตํ•  ๋•Œ ๋ฐœ์ƒํ•˜๋Š” โ€œ๋ชจ๋ธ ๋ถ•๊ดด(model collapse)โ€ ํ˜„์ƒ์— ๋Œ€ํ•ด ์—ฐ๊ตฌํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ๋…ผ๋ฌธ์˜ ํ•ต์‹ฌ ๋‚ด์šฉ์„ ์ž์„ธํžˆ ์„ค๋ช…ํ•˜๊ฒ ์Šต๋‹ˆ๋‹ค.

1. ๋ชจ๋ธ ๋ถ•๊ดด๋ž€ ๋ฌด์—‡์ธ๊ฐ€?

๋ชจ๋ธ ๋ถ•๊ดด๋Š” ํ•™์Šต๋œ ์ƒ์„ฑ ๋ชจ๋ธ๋“ค์ด ์ด์ „ ์„ธ๋Œ€์—์„œ ์ƒ์„ฑํ•œ ๋ฐ์ดํ„ฐ๋ฅผ ๋‹ค์‹œ ํ•™์Šตํ•  ๋•Œ ๋ฐœ์ƒํ•˜๋Š” ํ‡ดํ–‰์  ๊ณผ์ •์ž…๋‹ˆ๋‹ค.

  • ์ •์˜: ๋ชจ๋ธ ๋ถ•๊ดด๋Š” ํ•™์Šต๋œ ์ƒ์„ฑ ๋ชจ๋ธ์˜ ์„ธ๋Œ€์— ์˜ํ–ฅ์„ ๋ฏธ์น˜๋Š” ํ‡ดํ–‰์  ๊ณผ์ •์œผ๋กœ, ๋ชจ๋ธ์ด ์ƒ์„ฑํ•œ ๋ฐ์ดํ„ฐ๊ฐ€ ๋‹ค์Œ ์„ธ๋Œ€์˜ ํ›ˆ๋ จ ์„ธํŠธ๋ฅผ ์˜ค์—ผ์‹œํ‚ค๋Š” ํ˜„์ƒ์ž…๋‹ˆ๋‹ค. ์ด๋กœ ์ธํ•ด ํ›„์† ๋ชจ๋ธ๋“ค์ด ํ˜„์‹ค์„ ์ž˜๋ชป ์ธ์‹ํ•˜๊ฒŒ ๋ฉ๋‹ˆ๋‹ค.
  • ๋‘ ๊ฐ€์ง€ ํŠน์ˆ˜ ๊ฒฝ์šฐ:

    • ์กฐ๊ธฐ ๋ชจ๋ธ ๋ถ•๊ดด: ๋ชจ๋ธ์ด ๋ถ„ํฌ์˜ ๊ผฌ๋ฆฌ ์ •๋ณด(๋‚ฎ์€ ํ™•๋ฅ  ์ด๋ฒคํŠธ)๋ฅผ ์žƒ๊ธฐ ์‹œ์ž‘ํ•ฉ๋‹ˆ๋‹ค.
    • ํ›„๊ธฐ ๋ชจ๋ธ ๋ถ•๊ดด: ๋ชจ๋ธ์ด ์›๋ž˜ ๋ถ„ํฌ์™€ ๊ฑฐ์˜ ์œ ์‚ฌํ•˜์ง€ ์•Š์€ ๋ถ„ํฌ์— ์ˆ˜๋ ดํ•˜๋ฉฐ, ๋ถ„์‚ฐ์ด ์ƒ๋‹นํžˆ ์ค„์–ด๋“ญ๋‹ˆ๋‹ค.
  • ์›์ธ:

    • ํ†ต๊ณ„์  ๊ทผ์‚ฌ ์˜ค๋ฅ˜: ํ†ต๊ณ„์  ๊ทผ์‚ฌ ์˜ค๋ฅ˜๋Š” ์ƒ˜ํ”Œ ์ˆ˜๊ฐ€ ์œ ํ•œํ•  ๋•Œ ๋ฐœ์ƒํ•˜๋Š” ์˜ค๋ฅ˜์ž…๋‹ˆ๋‹ค. ์ด๋Š” ๋ชจ์ง‘๋‹จ์—์„œ ์ƒ˜ํ”Œ์„ ์ถ”์ถœํ•  ๋•Œ, ์ƒ˜ํ”Œ์˜ ํฌ๊ธฐ๊ฐ€ ์ถฉ๋ถ„ํ•˜์ง€ ์•Š๊ฑฐ๋‚˜ ์ƒ˜ํ”Œ์˜ ๋ถ„ํฌ๊ฐ€ ์› ๋ฐ์ดํ„ฐ์˜ ์‹ค์ œ ๋ถ„ํฌ๋ฅผ ์ž˜ ๋ฐ˜์˜ํ•˜์ง€ ๋ชปํ•  ๋•Œ ๋‚˜ํƒ€๋‚ฉ๋‹ˆ๋‹ค.

      • ์ƒ˜ํ”Œ์˜ ํฌ๊ธฐ: ์ƒ˜ํ”Œ ํฌ๊ธฐ๊ฐ€ ์ž‘์„ ๊ฒฝ์šฐ, ํŠนํžˆ ์ €ํ™•๋ฅ  ์ด๋ฒคํŠธ(์ฆ‰, ๋ฐœ์ƒ ๋นˆ๋„๊ฐ€ ๋งค์šฐ ๋‚ฎ์€ ์‚ฌ๊ฑด๋“ค)์˜ ์‚ฌ๋ก€๋Š” ํ†ต๊ณ„์ ์ธ ์‹๋ณ„์ด ์–ด๋ ต์Šต๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, ์ˆ˜์‹ญ ๊ฐœ์˜ ์ƒ˜ํ”Œ๋งŒ ์‚ฌ์šฉํ•˜๋Š” ๊ฒฝ์šฐ, ์ด ์ƒ˜ํ”Œ์ด ๋Œ€ํ‘œํ•  ์ˆ˜ ์žˆ๋Š” ์ „์ฒด ๋ชจ์ง‘๋‹จ์˜ ํŠน์„ฑ์„ ์ถฉ๋ถ„ํžˆ ๋ฐ˜์˜ํ•˜์ง€ ๋ชปํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
      • ๊ผฌ๋ฆฌ ์‚ฌ๋ผ์ง: ์‚ฌ๊ฑด์˜ ๊ผฌ๋ฆฌ ๋ถ€๋ถ„์€ ๋‹ค๋ฅธ ์‚ฌ๊ฑด์— ๋น„ํ•ด ๋ฐœ์ƒํ•  ๊ฐ€๋Šฅ์„ฑ์ด ๋งค์šฐ ๋‚ฎ๊ธฐ ๋•Œ๋ฌธ์—, ์ƒ˜ํ”Œ๋ง ๊ณผ์ •์—์„œ ์ด๋Ÿฐ ์‚ฌ๊ฑด๋“ค์ด ๋Œ€ํ‘œ์ ์œผ๋กœ ๋‚˜ํƒ€๋‚˜์ง€ ์•Š์„ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์‹œ๊ฐ„์ด ์ง€๋‚˜๋ฉด์„œ ๋ฐ˜๋ณต์ ์œผ๋กœ ๋ชจ๋ธ์ด ํ•™์Šตํ•  ๋•Œ, ์ด ์ €ํ™•๋ฅ  ์‚ฌ๊ฑด๋“ค์ด ์ ์  ๋” ์†Œ์™ธ๋˜๋ฉฐ ๊ฒฐ๊ตญ ์žŠํ˜€์ง€๊ณ , ๋ชจ๋ธ์˜ ๋ถ„ํฌ๋Š” ๋”์šฑ ์ค‘์•™์ง‘์ค‘์ ์œผ๋กœ ๋ณ€ํ•˜๊ฒŒ ๋ฉ๋‹ˆ๋‹ค.
    • ํ•จ์ˆ˜ ํ‘œํ˜„ ์˜ค๋ฅ˜: ํ•จ์ˆ˜ ํ‘œํ˜„ ์˜ค๋ฅ˜๋Š” ์‹ ๊ฒฝ๋ง์ด ํŠน์ • ํ•จ์ˆ˜ ๊ณต๊ฐ„ ๋‚ด์—์„œ ๋ฐ์ดํ„ฐ๋ฅผ ํ‘œํ˜„ํ•  ์ˆ˜ ์žˆ๋Š” ๋Šฅ๋ ฅ์˜ ํ•œ๊ณ„๋ฅผ ๋ฐ˜์˜ํ•ฉ๋‹ˆ๋‹ค. ์ด๋Š” ๋„คํŠธ์›Œํฌ ๊ตฌ์กฐ์˜ ํฌ๊ธฐ๋‚˜ ํ˜•ํƒœ์— ๋”ฐ๋ผ ๋‹ฌ๋ผ์ง‘๋‹ˆ๋‹ค.

      • ์œ ํ•œํ•œ ํ‘œํ˜„๋ ฅ: ์‹ ๊ฒฝ๋ง์€ ์ด๋ก ์ ์œผ๋กœ ๋ฌดํ•œํ•œ ํ‘œํ˜„๋ ฅ์„ ๊ฐ€์ง€๊ณ  ์žˆ์ง€๋งŒ, ์‹ค์ œ๋กœ ์‚ฌ์šฉ๋˜๋Š” ๋„คํŠธ์›Œํฌ์˜ ํฌ๊ธฐ๋‚˜ ๊ตฌ์กฐ๋Š” ์ œํ•œ์ ์ž…๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, ๋‹จ์ผ ์€๋‹‰์ธต์˜ ์‹ ๊ฒฝ๋ง์€ ๋ณต์žกํ•œ ๋น„์„ ํ˜• ํ•จ์ˆ˜๋กœ ์‚ฌ๋žŒ๋“ค์„ ํ‘œํ˜„ํ•  ์ˆ˜ ์—†์Šต๋‹ˆ๋‹ค.
      • ๋–จ์–ด์ง„ ๊ฐ€๋Šฅ์„ฑ: ์ด ์˜ค๋ฅ˜๋Š” ํŠน์ • ๊ตฌ๊ฐ„์—์„œ ์ค‘์š”ํ•œ ์ด๋ฒคํŠธ(์˜ˆ: ๊ทน๋‹จ์  ์‚ฌ๊ฑด)์— ๋Œ€ํ•ด ์ž˜๋ชป๋œ ํ™•๋ฅ  ์˜ˆ์ธก์„ ํ•˜๊ฒŒ ๋งŒ๋“ญ๋‹ˆ๋‹ค. ์ฆ‰, ๋ชจ๋ธ์ด ์ž˜ ์ ํ•ฉ๋˜์ง€ ์•Š๋Š” ๊ตฌ๊ฐ„์—์„œ ์ž˜๋ชป๋œ ๊ฐ€์ •์ด๋‚˜ ์ถ”์ •์— ์˜ํ•ด ์ค‘์š”ํ•œ ์ •๋ณด๋ฅผ ๋†“์น  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, ๋‘ ๊ฐœ์˜ ์„œ๋กœ ๋‹ค๋ฅธ ๊ฐ€์šฐ์‹œ์•ˆ ๋ถ„ํฌ๋ฅผ ๋‹จ์ผ ๊ฐ€์šฐ์‹œ์•ˆ ๋ถ„ํฌ๋กœ ๋ชจ๋ธ๋งํ•  ๊ฒฝ์šฐ, ์ด ์ •๋ณด ์†์‹ค์ด ๋ฐœ์ƒํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
    • ํ•จ์ˆ˜ ๊ทผ์‚ฌ ์˜ค๋ฅ˜: ํ•จ์ˆ˜ ๊ทผ์‚ฌ ์˜ค๋ฅ˜๋Š” ๋ชจ๋ธ์ด ์ฃผ์–ด์ง„ ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•ด ํ•™์Šตํ•˜๋Š” ๊ณผ์ •์—์„œ ๋ฐœ์ƒํ•˜๋Š” ์˜ค๋ฅ˜์ž…๋‹ˆ๋‹ค. ์ด๋Š” ๋ฌดํ•œํ•œ ๋ฐ์ดํ„ฐ์™€ ์™„๋ฒฝํ•œ ํ‘œํ˜„ ๊ฐ€๋Šฅ์„ฑ์—๋„ ๋ถˆ๊ตฌํ•˜๊ณ  ๋‚˜ํƒ€๋‚  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

      • ํ•™์Šต ์ ˆ์ฐจ์˜ ํ•œ๊ณ„: ํ•™์Šต ์•Œ๊ณ ๋ฆฌ์ฆ˜(์˜ˆ: ๊ฒฝ๋Ÿ‰ํ™”๋œ ๊ฒฝ๋Ÿ‰ ๊ฒฝ๋Ÿ‰ ๋„คํŠธ์›Œํฌ)์„ ์‚ฌ์šฉํ•˜๋Š” ๊ณผ์ •์—์„œ ๋ฐœ์ƒํ•  ์ˆ˜ ์žˆ๋Š” ๊ตฌ์กฐ์  ํŽธํ–ฅ๊ณผ ์˜ค๋ฅ˜๊ฐ€ ํฌํ•จ๋ฉ๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, ๊ฒฝ๋Ÿ‰ํ™”๋œ ๊ฒฝ๋Ÿ‰ ๊ฒฝ๋Ÿ‰ ๊ฒฝ๋Ÿ‰ ๊ฒฝ๋Ÿ‰ ๋ชจ๋ธ์€ ๋ฌดํ•œํ•œ ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•ด ํ›ˆ๋ จํ•˜๋”๋ผ๋„, ๋ณธ์งˆ์ ์œผ๋กœ ํ•™์Šตํ•˜์ง€ ๋ชปํ•˜๋Š” ๊ตฌ์กฐ์  ํ•œ๊ณ„๊ฐ€ ์กด์žฌํ•ฉ๋‹ˆ๋‹ค.
      • ๊ฒฐ๊ณผ์ ์ธ ์ €ํ•˜: ๊ทผ์‚ฌ ์‹œ์ ์—์„œ์˜ ์˜ค๋ฅ˜๋Š”, ์‹œ๊ฐ„์ด ์ง€๋‚จ์— ๋”ฐ๋ผ ํ•™์Šต๋œ ๋ชจ๋ธ์ด ์›๋ž˜์˜ ๋ฐ์ดํ„ฐ ๋ถ„ํฌ๋กœ๋ถ€ํ„ฐ ๋ฉ€์–ด์งˆ ์ˆ˜ ์žˆ๊ฒŒ ๋งŒ๋“ญ๋‹ˆ๋‹ค. ์ด๋Š” ๊ฐ ์„ธ๋Œ€๊ฐ€ ์•ž์„œ ์–ธ๊ธ‰ํ•œ ํ†ต๊ณ„์  ๋ฐ ํ‘œํ˜„๋ ฅ ์˜ค๋ฅ˜์™€ ํ•ฉ์ณ์ ธ, ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ ์ €ํ•˜๋กœ ์ด์–ด์งˆ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ํŠนํžˆ, ์ด๋Ÿฌํ•œ ์˜ค๋ฅ˜๊ฐ€ ๋ˆ„์ ๋˜๋ฉด ๋ชจ๋ธ์ด ์˜ˆ์ธกํ•˜๋Š” ๋ถ„ํฌ์™€ ์‹ค์ œ ๋ถ„ํฌ ๊ฐ„์˜ ์ฐจ์ด๊ฐ€ ์ ์  ๋” ์ปค์ง€๊ฒŒ ๋ฉ๋‹ˆ๋‹ค.
  • ๊ฒฐ๊ณผ: ์‹œ๊ฐ„์ด ์ง€๋‚จ์— ๋”ฐ๋ผ ๋ชจ๋ธ์€ ์›๋ž˜ ๋ฐ์ดํ„ฐ ๋ถ„ํฌ์— ๋Œ€ํ•œ ์ •๋ณด ์†์‹ค์ด ์žˆ์œผ๋ฉฐ, ์ด๋Š” ๋ถ„ํฌ์˜ ์ถ•์†Œ๋ฅผ ์ดˆ๋ž˜ํ•ฉ๋‹ˆ๋‹ค. ๋ชจ๋ธ์€ ์‹ค์ œ ํ˜„์‹ค์„ ์™œ๊ณกํ•˜์—ฌ, โ€˜ํ™•๋ฅ ์ด ๋†’์€ ์‚ฌ๊ฑดโ€™์€ ๊ณผ๋Œ€ํ‰๊ฐ€๋˜๊ณ , โ€˜ํ™•๋ฅ ์ด ๋‚ฎ์€ ์‚ฌ๊ฑดโ€™์€ ๊ณผ์†Œํ‰๊ฐ€๋ฉ๋‹ˆ๋‹ค.

๐Ÿ’ก ํ˜ผ๋ž€๋„(perplexity)๋Š” ๋ชจ๋ธ์ด ์–ผ๋งˆ๋‚˜ โ€œํ˜ผ๋ž€์Šค๋Ÿฌ์›Œโ€ํ•˜๋Š”์ง€๋ฅผ ๋‚˜ํƒ€๋‚ด๋Š” ์ง€ํ‘œ์ž…๋‹ˆ๋‹ค. ์ฆ‰, ์ฃผ์–ด์ง„ ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•ด ๋ชจ๋ธ์ด ์–ผ๋งˆ๋‚˜ ๋ถˆํ™•์‹คํ•œ์ง€๋ฅผ ์ธก์ •ํ•˜๋Š” ์ง€ํ‘œ๋กœ, ๊ฐ’์ด ๋‚ฎ์„์ˆ˜๋ก ๋ชจ๋ธ์ด ๋ฐ์ดํ„ฐ๋ฅผ ๋” ์ž˜ ์˜ˆ์ธกํ•˜๊ณ  ์žˆ๋‹ค๋Š” ์˜๋ฏธ์ž…๋‹ˆ๋‹ค.

  • ๋‚ฎ์€ perplexity๋Š” ๋ชจ๋ธ์ด ์ž˜ ํ•™์Šตํ•œ ๊ฒƒ์ด๊ณ , ๋†’์€ perplexity๋Š” ๋ชจ๋ธ์ด ์˜ˆ์ธก์— ์–ด๋ ค์›€์„ ๊ฒช๊ณ  ์žˆ๋‹ค๋Š” ๋œป์ž…๋‹ˆ๋‹ค.
  • ํŠนํžˆ, ์–ธ์–ด ๋ชจ๋ธ์—์„œ ํ…์ŠคํŠธ์˜ ์ž์—ฐ์Šค๋Ÿฌ์›€์„ ํ‰๊ฐ€ํ•  ๋•Œ ๋งค์šฐ ์œ ์šฉํ•˜๋ฉฐ, ๋‚ฎ์€ ํ˜ผ๋ž€๋„๋ฅผ ๋‹ฌ์„ฑํ• ์ˆ˜๋ก ๋ชจ๋ธ์ด ๋” ์ข‹์€ ์„ฑ๋Šฅ์„ ๋‚˜ํƒ€๋‚ธ๋‹ค๊ณ  ๋ณผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
    • ํ˜ผ๋ž€๋„(Perplexity)๋Š” ๊ธฐ๋ณธ์ ์œผ๋กœ ์–ธ์–ด ๋ชจ๋ธ์ด ํŠน์ • ๋‹จ์–ด ์‹œํ€€์Šค(๋ฌธ์žฅ ๋“ฑ)๋ฅผ ์˜ˆ์ธกํ•˜๋Š” ๋ฐ ์–ผ๋งˆ๋‚˜ ํšจ์œจ์ ์ธ์ง€๋ฅผ ๋‚˜ํƒ€๋‚ด๋Š” ์ง€ํ‘œ์ž…๋‹ˆ๋‹ค. ์ฐธ๊ณ ๋กœ, ์–ธ์–ด ๋ชจ๋ธ์—์„œ ํ˜ผ๋ž€๋„๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์ด ์ •์˜๋ฉ๋‹ˆ๋‹ค.

      PPL(W)=2H(W)PPL(W) = 2^{H(W)}PPL(W)=2H(W)

    • ์—ฌ๊ธฐ์„œ H(W)H(W)H(W)๋Š” ์‹œํ€€์Šค WWW์— ๋Œ€ํ•œ ๋ชจ๋ธ์˜ ํ‰๊ท  ๊ต์ฐจ ์—”ํŠธ๋กœํ”ผ์ž…๋‹ˆ๋‹ค.
    • ์–ธ์–ด ๋ชจ๋ธ์—์„œ ๊ต์ฐจ ์—”ํŠธ๋กœํ”ผ๋Š” ๋ชจ๋ธ์ด ์˜ˆ์ธกํ•œ ํ™•๋ฅ ๊ณผ ์‹ค์ œ ๋ฐ์ดํ„ฐ ๊ฐ„์˜ ์ฐจ์ด๋ฅผ ๋‚˜ํƒ€๋‚ด๋Š” ์ง€ํ‘œ์ž…๋‹ˆ๋‹ค.
    • ๊ฐ„๋‹จํ•˜๊ฒŒ ๋งํ•˜๋ฉด, ํ˜ผ๋ž€๋„๋Š” ๋ชจ๋ธ์ด ์˜ˆ์ธกํ•œ ํ™•๋ฅ ์˜ ์—ญ์ˆ˜์— ํ•ด๋‹นํ•˜๋ฉฐ, ๊ฐ’์ด ์ž‘์„์ˆ˜๋ก ๋ชจ๋ธ์ด ์˜ˆ์ธก์„ ์ž˜ํ•˜๊ณ  ์žˆ๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค.

๐Ÿ“Š Figure 1์€ โ€œ๋ชจ๋ธ ๋ถ•๊ดด(model collapse)โ€์˜ ํ”ผ๋“œ๋ฐฑ ๋ฉ”์ปค๋‹ˆ์ฆ˜๊ณผ ๊ด€๋ จ๋œ ํ•™์Šต ๊ณผ์ • ๋ฐ ์‹คํ—˜ ๊ฒฐ๊ณผ๋ฅผ ์‹œ๊ฐ์ ์œผ๋กœ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค. ๊ฐ ํ•˜์œ„ ๊ทธ๋ฆผ์ธ a, b, c๋Š” ๋‹ค๋ฅธ ์ธก๋ฉด์„ ๋‹ค๋ฃจ๊ณ  ์žˆ์œผ๋ฉฐ, ๋‹ค์Œ๊ณผ ๊ฐ™์€ ์˜๋ฏธ๋ฅผ ์ง€๋‹ˆ๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

(a) ๋ชจ๋ธ ๋ถ•๊ดด ์„ค์ •

  • Real Data (์‹ค์ œ ๋ฐ์ดํ„ฐ): ์ฒ˜์Œ์—๋Š” ์‚ฌ๋žŒ์ด ์ƒ์„ฑํ•œ ๊นจ๋—ํ•œ ๋ฐ์ดํ„ฐ๋กœ ํ•™์Šต์„ ์‹œ์ž‘ํ•ฉ๋‹ˆ๋‹ค.
  • Model 0, Model 1, Model n: Model 0์ด ๋จผ์ € ์‹ค์ œ ๋ฐ์ดํ„ฐ๋ฅผ ํ•™์Šตํ•˜๊ณ , ๊ทธ ์ดํ›„์—๋Š” Model 0์ด ์ƒ์„ฑํ•œ ๋ฐ์ดํ„ฐ๋ฅผ ๋‹ค์‹œ Model 1์ด ํ•™์Šตํ•˜๊ฒŒ ๋ฉ๋‹ˆ๋‹ค. ์ด ๊ณผ์ •์€ n์„ธ๋Œ€๊นŒ์ง€ ๋ฐ˜๋ณต๋ฉ๋‹ˆ๋‹ค.
  • ๋ชจ๋ธ ๋ถ•๊ดด: ์‹œ๊ฐ„์ด ์ง€๋‚˜๋ฉด์„œ, ๋ชจ๋ธ์ด ์ƒ์„ฑํ•œ ๋ฐ์ดํ„ฐ๋Š” ๋ชจ๋ธ ์ž์ฒด์˜ ํ˜„์‹ค์„ ์™œ๊ณกํ•˜๊ธฐ ์‹œ์ž‘ํ•ฉ๋‹ˆ๋‹ค. ํŠนํžˆ ์ €ํ™•๋ฅ  ์‚ฌ๊ฑด(๋“œ๋ฌธ ์‚ฌ๊ฑด)์„ ์ ์ฐจ ์žŠ์–ด๋ฒ„๋ฆฌ๊ฒŒ ๋ฉ๋‹ˆ๋‹ค. ๊ทธ๋ฆผ ์˜ค๋ฅธ์ชฝ์—์„œ ๋ถ‰์€ ํ™”์‚ดํ‘œ์™€ ๋…ธ๋ž€ ํ…์ŠคํŠธ๋Š” ๋ชจ๋ธ์ด ๊ณผ๋Œ€ํ‰๊ฐ€๋˜๋Š” ์‚ฌ๊ฑด(Probable events)๊ณผ ๊ณผ์†Œํ‰๊ฐ€๋˜๋Š” ์‚ฌ๊ฑด(Improbable events)์ด ์–ด๋–ป๊ฒŒ ํ˜„์‹ค์„ ์˜ค์—ผ์‹œํ‚ค๋Š”์ง€๋ฅผ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
    • Finite sampling(์œ ํ•œ ์ƒ˜ํ”Œ๋ง) ๋ฐ Approximate fitting(๊ทผ์‚ฌ ํ”ผํŒ…): ์ƒ˜ํ”Œ๋ง๊ณผ ํ”ผํŒ… ๊ณผ์ •์—์„œ ๋ฐœ์ƒํ•˜๋Š” ์˜ค๋ฅ˜๋กœ ์ธํ•ด ๋ชจ๋ธ ๋ถ•๊ดด๊ฐ€ ๊ฐ€์†ํ™”๋ฉ๋‹ˆ๋‹ค. ์‹œ๊ฐ„์ด ์ง€๋‚จ์— ๋”ฐ๋ผ ๋ชจ๋ธ์€ ํ˜„์‹ค๊ณผ ์ ์  ๋” ๋ฉ€์–ด์ง€๊ฒŒ ๋ฉ๋‹ˆ๋‹ค.

(b) ์›๋ณธ ๋ฐ์ดํ„ฐ ์—†์ด 5๋ฒˆ์˜ ํ•™์Šต ์—ํฌํฌ

๋‘ ๋ฒˆ์งธ ๊ทธ๋ฆผ์€ ์›๋ณธ ๋ฐ์ดํ„ฐ๋ฅผ ๋ณด์กดํ•˜์ง€ ์•Š๊ณ  5๋ฒˆ์˜ ์—ํฌํฌ ๋™์•ˆ ํ•™์Šตํ•œ ๋ชจ๋ธ๋“ค์˜ ์„ฑ๋Šฅ์„ ๋‚˜ํƒ€๋ƒ…๋‹ˆ๋‹ค.

  • ์™ผ์ชฝ ๊ทธ๋ž˜ํ”„๋Š” ๊ฐ ์„ธ๋Œ€์˜ ๋ชจ๋ธ์ด ์ƒ์„ฑํ•œ ๋ฐ์ดํ„ฐ ํฌ์ธํŠธ๋“ค์˜ perplexity(ํ˜ผ๋ž€๋„) ๋ถ„ํฌ๋ฅผ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค. Generation 0์—์„œ Generation 9๊นŒ์ง€์˜ ๋ฐ์ดํ„ฐ๋ฅผ ๋ณด์—ฌ์ฃผ๋ฉฐ, ์„ธ๋Œ€๊ฐ€ ์ง„ํ–‰๋ ์ˆ˜๋ก ๋ชจ๋ธ์ด ์ƒ์„ฑํ•œ ๋ฐ์ดํ„ฐ์˜ ๋ถ„ํฌ๊ฐ€ ์ ์  ๋” ์‹ค์ œ ๋ฐ์ดํ„ฐ์™€ ์ฐจ์ด๊ฐ€ ๋‚˜๊ธฐ ์‹œ์ž‘ํ•ฉ๋‹ˆ๋‹ค.
    • ์˜ˆ๋ฅผ ๋“ค์–ด, Generation 0์€ ์‹ค์ œ ๋ฐ์ดํ„ฐ์— ๊ฐ€๊น์ง€๋งŒ, Generation 9์œผ๋กœ ๊ฐˆ์ˆ˜๋ก ๋ถ„ํฌ๊ฐ€ ๋” ๋„“๊ณ  ๊ผฌ๋ฆฌ๊ฐ€ ๊ธธ์–ด์ง€๋ฉด์„œ, ๋ชจ๋ธ์ด ์ž˜๋ชป๋œ ๋ฐ์ดํ„ฐ๋ฅผ ์ƒ์„ฑํ•˜๋Š” ๊ฒฝํ–ฅ์ด ์ฆ๊ฐ€ํ•ฉ๋‹ˆ๋‹ค.
  • ์˜ค๋ฅธ์ชฝ ๊ทธ๋ž˜ํ”„๋Š” ๊ฐ ์„ธ๋Œ€์—์„œ ํ•™์Šต๋œ ๋ชจ๋ธ์ด ์›๋ณธ wikitext2 ๋ฐ์ดํ„ฐ์…‹์—์„œ ์–ผ๋งˆ๋‚˜ ์ž˜ ํ•™์Šตํ–ˆ๋Š”์ง€๋ฅผ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค. ์„ธ๋Œ€๊ฐ€ ์ง€๋‚ ์ˆ˜๋ก perplexity๊ฐ€ ์ฆ๊ฐ€ํ•˜๋Š”๋ฐ, ์ด๋Š” ๋ชจ๋ธ์ด ๋ฐ์ดํ„ฐ๋ฅผ ์ œ๋Œ€๋กœ ์ดํ•ดํ•˜์ง€ ๋ชปํ•˜๊ณ  ์žˆ๋‹ค๋Š” ๊ฒƒ์„ ์˜๋ฏธํ•ฉ๋‹ˆ๋‹ค.

(c) ์›๋ณธ ๋ฐ์ดํ„ฐ 10%๋ฅผ ๋ณด์กดํ•˜๊ณ  10๋ฒˆ์˜ ํ•™์Šต ์—ํฌํฌ

์„ธ ๋ฒˆ์งธ ๊ทธ๋ฆผ์€ ์›๋ณธ ๋ฐ์ดํ„ฐ์˜ 10%๋ฅผ ๋ณด์กดํ•˜๋ฉด์„œ 10๋ฒˆ์˜ ์—ํฌํฌ ๋™์•ˆ ํ•™์Šตํ•œ ๋ชจ๋ธ๋“ค์˜ ์„ฑ๋Šฅ์„ ๋‚˜ํƒ€๋ƒ…๋‹ˆ๋‹ค.

  • ์™ผ์ชฝ ๊ทธ๋ž˜ํ”„๋Š” b ๊ทธ๋ฆผ๊ณผ ์œ ์‚ฌํ•˜๊ฒŒ ๊ฐ ์„ธ๋Œ€์—์„œ ์ƒ์„ฑ๋œ ๋ฐ์ดํ„ฐ์˜ perplexity ๋ถ„ํฌ๋ฅผ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค. ์—ฌ๊ธฐ์„œ๋„ ์„ธ๋Œ€๊ฐ€ ์ง€๋‚จ์— ๋”ฐ๋ผ ํ˜ผ๋ž€๋„๊ฐ€ ์ฆ๊ฐ€ํ•˜์ง€๋งŒ, ์ผ๋ถ€ ์›๋ณธ ๋ฐ์ดํ„ฐ๋ฅผ ๋ณด์กดํ–ˆ๊ธฐ ๋•Œ๋ฌธ์— ๊ทธ ๋ณ€ํ™”๊ฐ€ ์กฐ๊ธˆ ๋” ์™„๋งŒํ•ฉ๋‹ˆ๋‹ค.
  • ์˜ค๋ฅธ์ชฝ ๊ทธ๋ž˜ํ”„๋Š” ์›๋ณธ ๋ฐ์ดํ„ฐ๋ฅผ ์ผ๋ถ€ ๋ณด์กดํ•จ์œผ๋กœ์จ, ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ ์ €ํ•˜๊ฐ€ ๋œ ๊ทน๋‹จ์ ์ด๋ผ๋Š” ์ ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค. ์›๋ณธ ๋ฐ์ดํ„ฐ๋ฅผ ์ „ํ˜€ ์‚ฌ์šฉํ•˜์ง€ ์•Š์€ b ๊ทธ๋ฆผ์— ๋น„ํ•ด perplexity๊ฐ€ ๋œ ์ฆ๊ฐ€ํ–ˆ์Šต๋‹ˆ๋‹ค.

๐Ÿค” ์„œ์ฟ  ์˜๊ฒฌ : ๊ทธ๋ ‡์ง€๋งŒ ์ œ ๊ฐœ์ธ์ ์ธ ์ƒ๊ฐ์œผ๋กœ๋Š” ์ „์ฒด ๋ฐ์ดํ„ฐ๋ฅผ ์ „๋ถ€ ๋‹ค synthetic ๋ฐ์ดํ„ฐ๋กœ ํ•™์Šตํ•˜๊ฒŒ ๋  ๊ฒฝ์šฐ๋Š” ๋“œ๋ฌผ๊ฑฐ ๊ฐ™์€๋ฐ, ํŠนํžˆ๋‚˜ augmentation๊ณผ ๊ฐ™์€ ๊ฒฝ์šฐ๋กœ ์“ฐ์ด์ง€ ์•Š์„๊นŒ ์ƒ๊ฐ์ด ๋“ค๊ธดํ•ฉ๋‹ˆ๋‹ค๋งŒโ€ฆ ์‹ค์ œ๋กœ ๋ญ ๊ฐœ์ธ์ •๋ณด ๋ณด์•ˆ์ด๋‚˜ ๊ทธ๋Ÿฐ ์ผ€์ด์Šค์—์„œ๋Š” ์ƒˆ๋กญ๊ฒŒ ๊ฐœ์ธ์ •๋ณด๊ฐ€ ์—†๋Š” ์ด๋ฏธ์ง€๋ฅผ ๋งŒ๋“ค๊ณ  ํ•™์Šต์„ ํ•˜๊ธฐ๋„ ํ•˜์ง€๋งŒ ์‹ ๊ธฐํ•˜๊ตฐ์š”.

2. ์ด๋ก ์  ์ง๊ด€

์—ฐ๊ตฌ์ง„์€ ๋ชจ๋ธ ๋ถ•๊ดด ํ˜„์ƒ์ด ๋ชจ๋“  ์ƒ์„ฑํ˜• ๋ชจ๋ธ์—์„œ ๋ฐœ์ƒํ•  ์ˆ˜ ์žˆ์Œ์„ ์ˆ˜ํ•™์ ์œผ๋กœ ์ฆ๋ช…ํ•ฉ๋‹ˆ๋‹ค. ํŠนํžˆ, ํ†ต๊ณ„์  ๊ทผ์‚ฌ ์˜ค๋ฅ˜์™€ ํ•จ์ˆ˜์  ํ‘œํ˜„๋ ฅ์˜ ํ•œ๊ณ„๊ฐ€ ๋ถ•๊ดด๋ฅผ ๊ฐ€์†ํ™”์‹œํ‚ต๋‹ˆ๋‹ค.

์ด๋ฏธ์ง€ ์ถœ์ฒ˜: ๊ธธ๋ฒ—

๋…ผ๋ฌธ์—์„œ๋Š” ์ด ํ˜„์ƒ์„ ์„ค๋ช…ํ•˜๊ธฐ ์œ„ํ•ด ๋‘ ๊ฐ€์ง€ ์ˆ˜ํ•™์  ๋ชจ๋ธ์„ ์‚ฌ์šฉํ–ˆ์Šต๋‹ˆ๋‹ค:

  • ์ด์‚ฐ ํ™•๋ฅ  ๋ถ„ํฌ: ์ด์‚ฐ ๋ถ„ํฌ์—์„œ ๋ชจ๋ธ ๋ถ•๊ดด๋Š” ์ฃผ๋กœ ํ†ต๊ณ„์  ์˜ค๋ฅ˜๋กœ ์ธํ•ด ๋ฐœ์ƒํ•ฉ๋‹ˆ๋‹ค. ์—ฌ๊ธฐ์„œ๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์€ ๋‚ด์šฉ์„ ํ†ตํ•ด ๋ชจ๋ธ ๋ถ•๊ดด๋ฅผ ์„ค๋ช…ํ•ฉ๋‹ˆ๋‹ค.

    • ํ†ต๊ณ„์  ๊ทผ์‚ฌ: ์ด ๊ฒฝ์šฐ, ํ•จ์ˆ˜ ๊ทผ์‚ฌ๋‚˜ ํ‘œํ˜„๋ ฅ ์˜ค๋ฅ˜๊ฐ€ ์—†๋Š” ์ƒํ™ฉ์—์„œ ๋ชจ๋ธ ๋ถ•๊ดด๋Š” ์˜ค๋กœ์ง€ ํ†ต๊ณ„์  ์˜ค๋ฅ˜์— ์˜ํ•ด ๋ฐœ์ƒํ•ฉ๋‹ˆ๋‹ค. ๋ฐ์ดํ„ฐ์˜ ์ƒ˜ํ”Œ๋ง ๊ณผ์ •์—์„œ ์ €ํ™•๋ฅ  ์‚ฌ๊ฑด์€ ํ†ต๊ณ„์ ์œผ๋กœ ์ž˜ ๋Œ€ํ‘œ๋˜์ง€ ๋ชปํ•˜๊ฒŒ ๋˜๋ฉฐ, ์ด๋กœ ์ธํ•ด ์ ์ฐจ์ ์œผ๋กœ ๊ทธ ์‚ฌ๊ฑด๋“ค์— ๋Œ€ํ•œ ์ •๋ณด๊ฐ€ ์žƒ์–ด๋ฒ„๋ ค์ ธ ๊ฐ€๋Š” ๊ณผ์ •์„ ์„ค๋ช…ํ•ฉ๋‹ˆ๋‹ค.
    • ํ™•๋ฅ  ์†์‹ค: ๊ฐ ์„ธ๋Œ€์˜ ํ›ˆ๋ จ์—์„œ ํŠน์ • ์‚ฌ๊ฑด์˜ ํ™•๋ฅ ์ด ๋‚ฎ์€ ๊ฒฝ์šฐ, ํ•ด๋‹น ์‚ฌ๊ฑด์„ ์ƒ˜ํ”Œ๋งํ•˜์ง€ ๋ชปํ•  ํ™•๋ฅ ์ด ์ฆ๊ฐ€ํ•ฉ๋‹ˆ๋‹ค. ์ด๋Š” ์‹œ๊ฐ„์ด ์ง€๋‚˜๋ฉด์„œ ๋ชจ๋ธ์ด ๋‚ฎ์€ ํ™•๋ฅ ๋กœ ๋ฐœ์ƒํ•˜๋Š” ์‚ฌ๊ฑด์„ ์žŠ๊ฒŒ ๋งŒ๋“ค๊ณ , ๊ฒฐ๊ณผ์ ์œผ๋กœ ๋ถ„ํฌ์˜ ๊ผฌ๋ฆฌ ๋ถ€๋ถ„์ด ์ ์ฐจ ์‚ฌ๋ผ์ง€๊ฒŒ ๋ฉ๋‹ˆ๋‹ค. ์ถ”์ •๋œ ๋ฐ์ดํ„ฐ ๋ถ„ํฌ๋Š” ๊ฒฐ๊ตญ ๋ธํƒ€ ํ•จ์ˆ˜ ํ˜•ํƒœ๋กœ ์ˆ˜๋ ดํ•˜๊ฒŒ ๋˜๋ฉฐ, ์ด๋Š” ๋ชจ๋ธ์ด ์›๋ž˜ ๋ฐ์ดํ„ฐ์˜ ํŠน์„ฑ์„ ๋” ์ด์ƒ ๋ฐ˜์˜ํ•˜์ง€ ๋ชปํ•˜๊ฒŒ ๋จ์„ ์‹œ์‚ฌํ•ฉ๋‹ˆ๋‹ค.
    • ๋งˆ๋ฅด์ฝ”ํ”„ ๊ณผ์ •: ์ด์‚ฐ ๋ถ„ํฌ์—์„œ์˜ ๋ชจ๋ธ ๋ถ•๊ดด๋ฅผ ๋งˆ๋ฅด์ฝ”ํ”„ ์ฒด์ธ(Markov Chain)์œผ๋กœ ์„ค๋ช…ํ•˜๋ฉฐ, ์ด ๊ณผ์ •์—์„œ๋Š” ๋‹ค์Œ ์„ธ๋Œ€์˜ ๋ถ„ํฌ๊ฐ€ ์ด์ „ ์„ธ๋Œ€์—๋งŒ ์˜์กดํ•œ๋‹ค๊ณ  ๊ฐ€์ •ํ•ฉ๋‹ˆ๋‹ค. ๋ชจ๋“  ์„ธ๋Œ€๊ฐ€ ๊ฐ™์€ ๊ฐ’์„ ๊ฐ€์งˆ ๊ฒฝ์šฐ, ํ›„์† ์„ธ๋Œ€์˜ ๋ถ„ํฌ๋Š” ๋ธํƒ€ ํ•จ์ˆ˜์™€ ๊ฐ™์•„์ง€๋ฉฐ, ๋”ฐ๋ผ์„œ ์›๋ž˜ ๋ถ„ํฌ์™€์˜ ์ •๋ณด๊ฐ€ ์™„์ „ํžˆ ์ƒ์‹ค๋ฉ๋‹ˆ๋‹ค.
  • ๋‹ค์ฐจ์› ๊ฐ€์šฐ์‹œ์•ˆ ๋ถ„ํฌ: ๋‹ค๋ณ€๋Ÿ‰ ๊ฐ€์šฐ์‹œ์•ˆ ๋ชจ๋ธ์—์„œ์˜ ๋ชจ๋ธ ๋ถ•๊ดด๋Š” ์—ฌ๋Ÿฌ ๊ฐ€์ง€ ํŠน์„ฑ์œผ๋กœ ์ธํ•ด ๋”์šฑ ๋ณต์žกํ•ฉ๋‹ˆ๋‹ค. ์—ฌ๊ธฐ์„œ๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์€ ์ ์œผ๋กœ ์„ค๋ช…๋ฉ๋‹ˆ๋‹ค.

    • ์žฌ๊ท€์  ์ ํ•ฉ: ๊ฐ ์„ธ๋Œ€๋Š” ์ด์ „ ์„ธ๋Œ€์˜ ํ‰๊ท  ๋ฐ ๋ถ„์‚ฐ์„ ๋ฐ”ํƒ•์œผ๋กœ ๋‹ค๋ณ€๋Ÿ‰ ๊ฐ€์šฐ์‹œ์•ˆ ๋ถ„ํฌ๋กœ ๋งž์ถฐ์ง€๋ฉฐ, ์ด๋Š” ์ƒ˜ํ”Œ ํฌ๊ธฐ๊ฐ€ ๊ณ ์ •๋˜์–ด ์žˆ์„ ๋•Œ ์‚ฌ์šฉ๋˜๋Š” ๋ฌดํŽธํ–ฅ ์ถ”์ •๋Ÿ‰์— ๋”ฐ๋ผ ์ˆ˜ํ–‰๋ฉ๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ์žฌ๊ท€์  ์ ํ•ฉ ๊ณผ์ •์—์„œ ์›๋ž˜ ๋ฐ์ดํ„ฐ ๋ถ„ํฌ์—์„œ ๋ฐœ์ƒํ•œ ํ†ต๊ณ„์  ์˜ค๋ฅ˜๊ฐ€ ๋ˆ„์ ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
    • ๋‹ค๋ณ€๋Ÿ‰ ํ•จ์ˆ˜ ๊ทผ์‚ฌ: ์ด ๊ณผ์ •์—์„œ ๋ฐœ์ƒํ•˜๋Š” ๋””์ง€ํ„ธ ํ†ต๊ณ„์  ๊ทผ์‚ฌ์™€ ํ‘œํ˜„๋ ฅ ์˜ค๋ฅ˜๋Š” ๊ฐ ์„ธ๋Œ€๊ฐ€ ์ด์ „ ์„ธ๋Œ€์˜ ๋ถ„ํฌ๋ฅผ ์ ์ฐจ์ ์œผ๋กœ ๋ถ€์ •ํ™•ํ•˜๊ฒŒ ๋งŒ๋“ค ์ˆ˜ ์žˆ์œผ๋ฉฐ, ๊ทธ ๊ฒฐ๊ณผ ์›๋ž˜ ๋ถ„ํฌ์—์„œ ์ ์  ๋” ๋ฉ€์–ด์ง€๊ฒŒ ๋ฉ๋‹ˆ๋‹ค. ์ด๋Š” ๊ฒฐ๊ตญ ๋ชจ๋ธ์ด ์›๋ž˜์˜ ๋ฐ์ดํ„ฐ ๋ถ„ํฌ๋กœ๋ถ€ํ„ฐ ๋™๋–จ์–ด์ง„ ๋ถ„ํฌ๋กœ ์ˆ˜๋ ดํ•˜๊ฒŒ ๋งŒ๋“ญ๋‹ˆ๋‹ค.
    • ์ˆ˜๋ ด๊ณผ ๋ถ„์‚ฐ ๊ฐ์†Œ: ๋…ผ๋ฌธ์—์„œ๋Š” ์›๋ž˜ ๋ฐ์ดํ„ฐ๊ฐ€ ๋ถ„์‚ฐ์ด ์žˆ๋Š” ๋น„๊ฐ€์šฐ์‹œ์•ˆ ๋ถ„ํฌ์—์„œ ์ƒ˜ํ”Œ๋ง๋œ๋‹ค๊ณ  ๊ฐ€์ •ํ•˜๋ฉฐ, ์ด ๊ฐ ์„ธ๋Œ€์˜ ์ถ”์ •๋œ ๋ถ„ํฌ๊ฐ€ ์›๋ž˜ ๋ถ„ํฌ๋กœ๋ถ€ํ„ฐ ๋ฌดํ•œํžˆ ๋ฉ€์–ด์ง€๊ณ , ๋™์ผํ•œ ์‹œ๊ฐ„ ๋‚ด์— ๋ถ„์‚ฐ์ด ์ œ๋กœ๋กœ ์ˆ˜๋ ดํ•˜๊ฒŒ ๋˜๋Š” ๊ณผ์ •์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค. ์ด๋กœ ์ธํ•ด, ์ ์ฐจ์ ์œผ๋กœ ๋ชจ๋ธ์ด ๋™์ผํ•œ ์ƒํƒœ๋กœ ์ˆ˜๋ ดํ•˜๊ฒŒ ๋˜๊ณ , ์ดˆ๊ธฐ ๋ฐ์ดํ„ฐ๋ฅผ ํ•™์Šตํ•˜๋Š” ๋ฐ ํ•„์š”ํ•œ ์ •๋ณด๋ฅผ ์ „๋ถ€ ์žƒ๊ฒŒ ๋ฉ๋‹ˆ๋‹ค.

3. ์–ธ์–ด ๋ชจ๋ธ์—์„œ์˜ ๋ถ•๊ดด

์ด ์ฑ•ํ„ฐ๋Š” ์ฃผ๋กœ LLM์—์„œ ๋ชจ๋ธ ๋ถ•๊ดด๊ฐ€ ์–ด๋–ป๊ฒŒ ์ง„ํ–‰๋˜๋Š”์ง€, ๊ทธ ๊ณผ์ •์—์„œ ๋ฐœ์ƒํ•˜๋Š” ์„ฑ๋Šฅ ์ €ํ•˜๋ฅผ ์„ค๋ช…ํ•˜๋ฉฐ, ์‹คํ—˜์„ ํ†ตํ•ด ์ด ํ˜„์ƒ์„ ์ž…์ฆํ•˜๋ ค๊ณ  ํ•ฉ๋‹ˆ๋‹ค.

3.1. ๋ฐฐ๊ฒฝ

์ด์ „ ์‹คํ—˜๋“ค์€ ๋น„๊ต์  ๋‹จ์ˆœํ•œ ๋ชจ๋ธ๋“ค(์˜ˆ: ๊ฐ€์šฐ์‹œ์•ˆ ํ˜ผํ•ฉ ๋ชจ๋ธ(GMM)์ด๋‚˜ ๋ณ€๋ถ„ ์˜คํ† ์ธ์ฝ”๋”(VAE))์—์„œ ๋ชจ๋ธ ๋ถ•๊ดด๊ฐ€ ๋ฐœ์ƒํ•˜๋Š” ๊ฒƒ์„ ํ™•์ธํ–ˆ์Šต๋‹ˆ๋‹ค. (์•ž์žฅ 2)

ํ•˜์ง€๋งŒ ๋Œ€ํ˜• ์–ธ์–ด ๋ชจ๋ธ(LLM)์€ ๊ทธ ๊ทœ๋ชจ์™€ ๋ณต์žก์„ฑ ๋•Œ๋ฌธ์— ์•ฝ๊ฐ„ ๋‹ค๋ฅธ ๋ฐฉ์‹์œผ๋กœ ๋ถ•๊ดด ํ˜„์ƒ์ด ๋‚˜ํƒ€๋‚ฉ๋‹ˆ๋‹ค. LLM์€ ๋งค์šฐ ํฐ ๋ฐ์ดํ„ฐ์…‹์„ ์‚ฌ์šฉํ•ด ํ›ˆ๋ จ๋˜๋ฉฐ, ์ฃผ๋กœ GPT-2, RoBERTa, BERT์™€ ๊ฐ™์€ ๋Œ€ํ˜• ๋ชจ๋ธ๋“ค์„ ์ฒ˜์Œ๋ถ€ํ„ฐ ๋‹ค์‹œ ํ›ˆ๋ จํ•˜์ง€ ์•Š๊ณ , ์‚ฌ์ „ ํ•™์Šต๋œ ๋ชจ๋ธ์„ ๋ฏธ์„ธ ์กฐ์ •(fine-tuning)ํ•˜๋Š” ๋ฐฉ์‹์œผ๋กœ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค.

์ด ์ฑ•ํ„ฐ๋Š” LLM์—์„œ ๋ชจ๋ธ ๋ถ•๊ดด ํ˜„์ƒ์ด ์‹ค์ œ๋กœ ๋ฐœ์ƒํ•˜๋Š”์ง€, ๊ทธ๋ฆฌ๊ณ  ๊ทธ ์ •๋„๊ฐ€ ์–ด๋–ป๊ฒŒ ๋‹ค๋ฅธ์ง€์— ๋Œ€ํ•ด ์„ค๋ช…ํ•ฉ๋‹ˆ๋‹ค.

3.2. ๋ชจ๋ธ ๋ถ•๊ดด ์‹คํ—˜

LLM์—์„œ ๋ชจ๋ธ ๋ถ•๊ดด๋ฅผ ์žฌํ˜„ํ•˜๊ธฐ ์œ„ํ•ด, ์—ฐ๊ตฌ์ง„์€ OPT-125m์ด๋ผ๋Š” ์–ธ์–ด ๋ชจ๋ธ์„ ์‚ฌ์šฉํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด ๋ชจ๋ธ์€ Meta(๋ฉ”ํƒ€)์—์„œ ์ œ๊ณตํ•œ ๋ชจ๋ธ๋กœ, wikitext2 ๋ฐ์ดํ„ฐ์…‹์„ ์‚ฌ์šฉํ•ด ํ•™์Šต๋˜์—ˆ์Šต๋‹ˆ๋‹ค.

OPT-125m์€ Meta์—์„œ ๊ฐœ๋ฐœํ•œ ์˜คํ”ˆAI ์–ธ์–ด ๋ชจ๋ธ ์‹œ๋ฆฌ์ฆˆ ์ค‘ ํ•˜๋‚˜๋กœ, ํ›ˆ๋ จ๋œ ๋งค๊ฐœ๋ณ€์ˆ˜ ์ˆ˜๊ฐ€ ์•ฝ 125๋ฐฑ๋งŒ ๊ฐœ(125 million)์ธ ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค.

  • โ€œOPTโ€๋Š” โ€œOpen Pre-trained Transformerโ€์˜ ์•ฝ์–ด๋กœ, ์ด ๋ชจ๋ธ์€ Transformer ์•„ํ‚คํ…์ฒ˜๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•˜์—ฌ ์„ค๊ณ„๋˜์—ˆ์Šต๋‹ˆ๋‹ค.

OPT-125m ๋ชจ๋ธ์€ ๋‹ค์–‘ํ•œ ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ(NLP) ์ž‘์—…์—์„œ ์‚ฌ์šฉ๋  ์ˆ˜ ์žˆ์œผ๋ฉฐ, ํŠนํžˆ ํ…์ŠคํŠธ ์ƒ์„ฑ, ์งˆ๋ฌธ ์‘๋‹ต, ๋Œ€ํ™”ํ˜• AI ๋ฐ ๊ธฐํƒ€ ์–ธ์–ด ๊ด€๋ จ ์ž‘์—…์—์„œ ํ™œ์šฉ๋ฉ๋‹ˆ๋‹ค. OPT ๋ชจ๋ธ์€ ๊ณต๊ณต ๋ฐ์ดํ„ฐ์™€ ์ธ๊ณต์ง€๋Šฅ ์ƒํƒœ๊ณ„์˜ ๋ฐœ์ „์— ๊ธฐ์—ฌํ•˜๋Š” ๋ฐฉํ–ฅ์œผ๋กœ ๊ฐœ๋ฐœ๋˜์—ˆ๊ณ , ์‚ฌ์šฉ์ž๋“ค์ด ์‰ฝ๊ฒŒ ์ ‘๊ทผํ•  ์ˆ˜ ์žˆ๋„๋ก ํ•˜์—ฌ ์—ฐ๊ตฌ ๋ฐ ์ƒ์šฉ ์‘์šฉ ํ”„๋กœ๊ทธ๋žจ์—์„œ ํ™œ์šฉ๋  ์ˆ˜ ์žˆ๋„๋ก ๋˜์–ด ์žˆ์Šต๋‹ˆ๋‹ค.

๋…ผ๋ฌธ์—์„œ๋Š” OPT-125m์€ ํฐ ๋ชจ๋ธ์— ๋น„ํ•ด ์ƒ๋Œ€์ ์œผ๋กœ ์ ์€ ์ˆ˜์˜ ๋งค๊ฐœ๋ณ€์ˆ˜๋ฅผ ๊ฐ€์ง€๋ฏ€๋กœ, ํ›ˆ๋ จ ๋ฐ ์‹คํ–‰ ๋น„์šฉ์ด ๋‚ฎ์•„ ๋‹ค์–‘ํ•œ ํ™˜๊ฒฝ์—์„œ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๋Š” ์ด์ ์ด ์žˆ๋‹ค๊ณ  ์–˜๊ธฐํ•ฉ๋‹ˆ๋‹ค.

๐Ÿค” ์„œ์ฟ  ์˜๊ฒฌ : ๊ทธ๋ƒฅ ์ž‘์€ ๋ชจ๋ธ์ด๋ผ์„œ synthetic ๋ฐ์ดํ„ฐ์— ์ทจ์•ฝํ•œ ๊ฑฐ์ผ ์ˆ˜๋„ ์žˆ์ง€ ์•Š์„๊นŒ?

  • OPT-125m์€ ๋งค๊ฐœ๋ณ€์ˆ˜(parameter)๊ฐ€ ์•ฝ 1์–ต 2์ฒœ 5๋ฐฑ๋งŒ ๊ฐœ๋กœ, GPT-3๋‚˜ GPT-4 ๊ฐ™์€ ์ดˆ๋Œ€ํ˜• ์–ธ์–ด ๋ชจ๋ธ๊ณผ ๋น„๊ตํ•˜๋ฉด ์ƒ๋Œ€์ ์œผ๋กœ ์ž‘์€ ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค. ์ผ๋ฐ˜์ ์œผ๋กœ ๋ชจ๋ธ ํฌ๊ธฐ๊ฐ€ ํด์ˆ˜๋ก ๋” ๋ณต์žกํ•œ ํŒจํ„ด์„ ํ•™์Šตํ•  ์ˆ˜ ์žˆ์œผ๋ฉฐ, ๋‹ค์–‘ํ•œ ๋ฐ์ดํ„ฐ์—์„œ ๋” ์ข‹์€ ์„ฑ๋Šฅ์„ ๋ณด์ด๋Š” ๊ฒฝํ–ฅ์ด ์žˆ์Šต๋‹ˆ๋‹ค.
  • ์ž‘์€ ๋ชจ๋ธ์€ ํฐ ๋ชจ๋ธ์— ๋น„ํ•ด ํ•™์Šต ๋ฐ์ดํ„ฐ์˜ ํŒจํ„ด์„ ์ถฉ๋ถ„ํžˆ ํฌ์ฐฉํ•˜์ง€ ๋ชปํ•  ๊ฐ€๋Šฅ์„ฑ์ด ๋†’์Šต๋‹ˆ๋‹ค. ์ด ๋•Œ๋ฌธ์— ํ•ฉ์„ฑ ๋ฐ์ดํ„ฐ๋‚˜ ๋…ธ์ด์ฆˆ๊ฐ€ ๋งŽ์€ ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•ด ๋” ์‰ฝ๊ฒŒ ๊ณผ์ ํ•ฉํ•˜๊ฑฐ๋‚˜, ์™œ๊ณก๋œ ํŒจํ„ด์„ ํ•™์Šตํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด ํ˜„์ƒ์€ ์ž‘์€ ๋ชจ๋ธ์ด ๋” ์ ์€ ๋งค๊ฐœ๋ณ€์ˆ˜๋ฅผ ๊ฐ€์ง€๊ณ  ์žˆ๊ธฐ ๋•Œ๋ฌธ์—, ๋ฐ์ดํ„ฐ์—์„œ ์ž˜๋ชป๋œ ํŒจํ„ด์ด ํฌํ•จ๋  ๊ฒฝ์šฐ ์ด๋ฅผ ๊ทน๋ณตํ•  ๋Šฅ๋ ฅ์ด ๋ถ€์กฑํ•˜๊ธฐ ๋•Œ๋ฌธ์ž…๋‹ˆ๋‹ค.

1) ์‹คํ—˜ ์„ค์ •

  • ์—ฐ๊ตฌ์ง„์€ ๋ฏธ์„ธ ์กฐ์ •(fine-tuning) ํ™˜๊ฒฝ์—์„œ ์‹คํ—˜์„ ์ง„ํ–‰ํ–ˆ์Šต๋‹ˆ๋‹ค. ๋ฏธ์„ธ ์กฐ์ •์€ ์ด๋ฏธ ์‚ฌ์ „ ํ•™์Šต๋œ ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•˜๊ณ , ์ด๋ฅผ ์ƒˆ๋กœ์šด ๋ฐ์ดํ„ฐ๋กœ ์ถ”๊ฐ€ ํ•™์Šต์‹œํ‚ค๋Š” ๊ณผ์ •์ž…๋‹ˆ๋‹ค.
  • ์ด ์‹คํ—˜์—์„œ๋Š” ๊ฐ ์„ธ๋Œ€์˜ ๋ชจ๋ธ์ด ์ƒ์„ฑํ•œ ๋ฐ์ดํ„ฐ๋ฅผ ์‚ฌ์šฉํ•ด ๋‹ค์Œ ์„ธ๋Œ€์˜ ๋ชจ๋ธ์„ ํ•™์Šต์‹œํ‚ต๋‹ˆ๋‹ค. ์ฆ‰, ๋ชจ๋ธ n ์„ธ๋Œ€๋Š” ๋ชจ๋ธ n-1 ์„ธ๋Œ€๊ฐ€ ์ƒ์„ฑํ•œ ๋ฐ์ดํ„ฐ๋ฅผ ํ•™์Šตํ•˜๋Š” ๋ฐฉ์‹์œผ๋กœ ์ง„ํ–‰๋ฉ๋‹ˆ๋‹ค.
  • ํ•™์Šต์€ ๋‘ ๊ฐ€์ง€ ์กฐ๊ฑด์—์„œ ์ˆ˜ํ–‰๋˜์—ˆ์Šต๋‹ˆ๋‹ค:

    • ์›๋ณธ ๋ฐ์ดํ„ฐ๋ฅผ ์‚ฌ์šฉํ•˜์ง€ ์•Š๊ณ  5๋ฒˆ์˜ ์—ํฌํฌ(epoch) ๋™์•ˆ ํ•™์Šต.
    • ์›๋ณธ ๋ฐ์ดํ„ฐ์˜ 10%๋ฅผ ๋ณด์กดํ•˜๋ฉด์„œ 10๋ฒˆ์˜ ์—ํฌํฌ(epoch) ๋™์•ˆ ํ•™์Šต.

2) ์‹คํ—˜ ๊ณผ์ •

์‹คํ—˜์€ ๋‹ค์Œ๊ณผ ๊ฐ™์ด ์ง„ํ–‰๋˜์—ˆ์Šต๋‹ˆ๋‹ค:

  • ์›๋ณธ wikitext2 ๋ฐ์ดํ„ฐ์…‹์—์„œ ๋ชจ๋ธ์„ ํ›ˆ๋ จ์‹œํ‚ต๋‹ˆ๋‹ค. ํ›ˆ๋ จ๋œ ๋ชจ๋ธ์€ 64๊ฐœ์˜ ํ† ํฐ ๋‹จ์œ„๋กœ ๋ฐ์ดํ„ฐ๋ฅผ ์˜ˆ์ธกํ•ฉ๋‹ˆ๋‹ค.
  • ๊ฐ ์„ธ๋Œ€์—์„œ ๋ชจ๋ธ์ด ์ƒ์„ฑํ•œ ๋ฐ์ดํ„ฐ๋ฅผ ๋‹ค์‹œ ํ•™์Šต์— ์‚ฌ์šฉํ•˜์—ฌ ์ƒˆ๋กœ์šด ์„ธ๋Œ€๋ฅผ ํ›ˆ๋ จํ•ฉ๋‹ˆ๋‹ค.
  • ์ด๋Ÿฌํ•œ ์‹คํ—˜์„ 5๋ฒˆ ๋ฐ˜๋ณตํ–ˆ์œผ๋ฉฐ, ๊ฐ ์‹คํ—˜์€ ๋‹ค๋ฅธ ๋ฌด์ž‘์œ„ ์ดˆ๊ธฐ๊ฐ’(seed)์„ ์‚ฌ์šฉํ•˜์—ฌ ์ง„ํ–‰๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ๊ทธ ๊ฒฐ๊ณผ, ๋ชจ๋ธ์ด ์ƒ์„ฑํ•œ ๋ฐ์ดํ„ฐ์˜ perplexity(ํ˜ผ๋ž€๋„)๊ฐ€ ์–ด๋–ป๊ฒŒ ๋ณ€ํ™”ํ•˜๋Š”์ง€๋ฅผ ์ธก์ •ํ–ˆ์Šต๋‹ˆ๋‹ค.

3.3. ๊ฒฐ๊ณผ ๋ถ„์„

๋ชจ๋ธ ๋ถ•๊ดด ์‹คํ—˜ ๊ฒฐ๊ณผ๋Š” ๋ชจ๋ธ ๋ถ•๊ดด๊ฐ€ ์‹ค์ œ๋กœ LLM์—์„œ ๋ฐœ์ƒํ•˜๋ฉฐ, ๊ทธ ๊ณผ์ •์—์„œ ์„ฑ๋Šฅ์ด ์ €ํ•˜๋˜๋Š” ๊ฒƒ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค. ์ด ์‹คํ—˜์€ ๋‘ ๊ฐ€์ง€ ์ฃผ์š” ์„ค์ •์—์„œ ์ง„ํ–‰๋˜์—ˆ์œผ๋ฉฐ, ๊ฐ ์„ค์ •์—์„œ์˜ ๊ฒฐ๊ณผ๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค.

(1) ์›๋ณธ ๋ฐ์ดํ„ฐ ์—†์ด 5๋ฒˆ์˜ ์—ํฌํฌ

์ด ์‹คํ—˜์—์„œ๋Š” ํ•™์Šต ์ดˆ๊ธฐ์—๋งŒ ์›๋ณธ ๋ฐ์ดํ„ฐ๋ฅผ ์‚ฌ์šฉํ•˜๊ณ , ์ดํ›„์—๋Š” ์ด์ „ ์„ธ๋Œ€ ๋ชจ๋ธ์ด ์ƒ์„ฑํ•œ ๋ฐ์ดํ„ฐ๋กœ๋งŒ ํ•™์Šต์„ ์ง„ํ–‰ํ–ˆ์Šต๋‹ˆ๋‹ค.

  • ์‹คํ—˜ ๊ฒฐ๊ณผ, ํ˜ผ๋ž€๋„(perplexity)๊ฐ€ ๊ธ‰๊ฒฉํžˆ ์ฆ๊ฐ€ํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด๋Š” ๋ชจ๋ธ์ด ๋ฐ์ดํ„ฐ์˜ ํŠน์„ฑ์„ ์žƒ๊ณ , ์ ์ฐจ ์ž˜๋ชป๋œ ๋ฐ์ดํ„ฐ๋ฅผ ํ•™์Šตํ–ˆ๊ธฐ ๋•Œ๋ฌธ์ž…๋‹ˆ๋‹ค.
  • ๊ทธ๋ž˜ํ”„์—์„œ ๋ณด๋“ฏ์ด, ์„ธ๋Œ€๊ฐ€ ๋ฐ˜๋ณต๋ ์ˆ˜๋ก ํ˜ผ๋ž€๋„๊ฐ€ ์ƒ์Šนํ•˜๋ฉฐ, ์ด๋Š” ๋ชจ๋ธ์ด ์ ์  ๋” ์‹ค์ œ ๋ฐ์ดํ„ฐ๋ฅผ ์ œ๋Œ€๋กœ ์ดํ•ดํ•˜์ง€ ๋ชปํ•˜๊ฒŒ ๋จ์„ ๋‚˜ํƒ€๋ƒ…๋‹ˆ๋‹ค.
  • ์„ธ๋Œ€๊ฐ€ ์ง€๋‚ ์ˆ˜๋ก: ์ดˆ๊ธฐ ์„ธ๋Œ€์—์„œ ์„ฑ๋Šฅ์ด ๊ธ‰๊ฒฉํžˆ ๋–จ์–ด์ง€๋ฉฐ, ์„ธ๋Œ€๊ฐ€ ๊ฑฐ๋“ญ๋ ์ˆ˜๋ก ๋” ์ด์ƒ ๊ฐœ์„ ๋˜์ง€ ์•Š๊ณ  ์ผ์ •ํ•œ ์ˆ˜์ค€์—์„œ ์„ฑ๋Šฅ์ด ์ •์ฒด๋˜๋Š” ๊ฒฝํ–ฅ์ด ์žˆ์Šต๋‹ˆ๋‹ค.

(2) ์›๋ณธ ๋ฐ์ดํ„ฐ 10%๋ฅผ ๋ณด์กดํ•œ ๊ฒฝ์šฐ

์ด ์‹คํ—˜์—์„œ๋Š” ๊ฐ ์„ธ๋Œ€์—์„œ ์›๋ณธ ๋ฐ์ดํ„ฐ์˜ 10%๋ฅผ ์œ ์ง€ํ•˜๋ฉด์„œ ํ•™์Šต์„ ์ง„ํ–‰ํ–ˆ์Šต๋‹ˆ๋‹ค.

  • ์ด ์„ค์ •์—์„œ๋Š” ํ˜ผ๋ž€๋„๊ฐ€ ๋œ ๊ธ‰๊ฒฉํžˆ ์ฆ๊ฐ€ํ–ˆ์œผ๋ฉฐ, ๋ชจ๋ธ ์„ฑ๋Šฅ์ด ์กฐ๊ธˆ ๋” ์œ ์ง€๋˜์—ˆ์Šต๋‹ˆ๋‹ค.
  • ์›๋ณธ ๋ฐ์ดํ„ฐ๋ฅผ ์ผ๋ถ€๋ผ๋„ ๋ณด์กดํ•จ์œผ๋กœ์จ, ๋ชจ๋ธ ๋ถ•๊ดด๋ฅผ ์–ด๋А ์ •๋„ ๋Šฆ์ถœ ์ˆ˜ ์žˆ์Œ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
  • ๊ทธ๋ž˜ํ”„์—์„œ๋„ ํ˜ผ๋ž€๋„๊ฐ€ ์ ์ง„์ ์œผ๋กœ ์ฆ๊ฐ€ํ•˜์ง€๋งŒ, ์›๋ณธ ๋ฐ์ดํ„ฐ๋ฅผ ์ „ํ˜€ ์‚ฌ์šฉํ•˜์ง€ ์•Š์€ ๊ฒฝ์šฐ์— ๋น„ํ•ด ๋œ ๊ทน๋‹จ์ ์ž…๋‹ˆ๋‹ค.

3.4. ํ…์ŠคํŠธ ์ƒ์„ฑ ์˜ˆ์‹œ

๋…ผ๋ฌธ์—์„œ๋Š” ํ…์ŠคํŠธ ์ƒ์„ฑ ์˜ˆ์‹œ๋„ ํฌํ•จ๋˜์–ด ์žˆ๋Š”๋ฐ, ์ด๋Š” ๊ฐ ์„ธ๋Œ€์—์„œ ๋ชจ๋ธ์ด ์ƒ์„ฑํ•œ ํ…์ŠคํŠธ์˜ ์งˆ์ด ์–ด๋–ป๊ฒŒ ์•…ํ™”๋˜๋Š”์ง€๋ฅผ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.

  • Generation 0: ์›๋ณธ wikitext2 ๋ฐ์ดํ„ฐ๋กœ ํ•™์Šตํ•œ ์ดˆ๊ธฐ ๋ชจ๋ธ์€ ๋น„๊ต์  ์ž์—ฐ์Šค๋Ÿฝ๊ณ  ์˜๋ฏธ ์žˆ๋Š” ๋ฌธ์žฅ์„ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค.
  • Generation 1: ์ฒซ ๋ฒˆ์งธ ์„ธ๋Œ€์—์„œ๋Š” ๋ฌธ์žฅ ๊ตฌ์กฐ๋Š” ์—ฌ์ „ํžˆ ๋‚จ์•„ ์žˆ์ง€๋งŒ, ๋‚ด์šฉ์˜ ์ผ๊ด€์„ฑ์ด ๋–จ์–ด์ง€๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.
  • Generation 5: ๋‹ค์„ฏ ๋ฒˆ์งธ ์„ธ๋Œ€์—์„œ๋Š” ๋ฌธ์žฅ์ด ๋‚œํ•ดํ•˜๊ณ , ์ผ๊ด€์„ฑ์ด ์—†๋Š” ๋‚ด์šฉ๋“ค์ด ํฌํ•จ๋˜๊ธฐ ์‹œ์ž‘ํ•ฉ๋‹ˆ๋‹ค.
  • Generation 9: ์•„ํ™‰ ๋ฒˆ์งธ ์„ธ๋Œ€์—์„œ๋Š” ๋ชจ๋ธ์ด ๊ฑฐ์˜ ์˜๋ฏธ ์—†๋Š” ๋ฌด์ž‘์œ„์ ์ธ ๋‹จ์–ด๋“ค์„ ์ƒ์„ฑํ•˜๋ฉฐ, ์™„์ „ํžˆ ๋ถ•๊ดด๋œ ์ƒํƒœ๋ฅผ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.

3.5. ๋ฐ˜๋ณต ํ˜„์ƒ(Ablation: Repetitions)

๋ชจ๋ธ์ด ๋ถ•๊ดด๋˜๋ฉด, ์ƒ์„ฑ๋œ ํ…์ŠคํŠธ์—์„œ ๋ฐ˜๋ณต์ ์ธ ๊ตฌ๋ฌธ์ด ์ž์ฃผ ๋“ฑ์žฅํ•˜๋Š” ๋ฌธ์ œ๊ฐ€ ๋ฐœ์ƒํ•ฉ๋‹ˆ๋‹ค. ๋…ผ๋ฌธ์—์„œ๋Š” ์ด ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด ๋ฐ˜๋ณต ํŽ˜๋„ํ‹ฐ(repetition penalty)๋ฅผ ์ ์šฉํ•œ ์‹คํ—˜๋„ ์ง„ํ–‰ํ–ˆ์œผ๋‚˜, ์ด๋Š” ์˜คํžˆ๋ ค ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ์„ ๋”์šฑ ์ €ํ•˜์‹œ์ผฐ์Šต๋‹ˆ๋‹ค.

4. Discussion

์ด ์„น์…˜์—์„œ๋Š” ๋ชจ๋ธ ๋ถ•๊ดด์˜ ์žฅ๊ธฐ์  ์˜ํ–ฅ๊ณผ ์–ธ์–ด ๋ชจ๋ธ์—์„œ์˜ ํ•จ์˜์— ๋Œ€ํ•ด ๋…ผ์˜ํ•ฉ๋‹ˆ๋‹ค.

๋ชจ๋ธ ๋ถ•๊ดด์˜ ์žฅ๊ธฐ์  ์˜ํ–ฅ

์—ฐ๊ตฌํŒ€์€ LLM์˜ ํ•™์Šต์—์„œ ๋ฐœ์ƒํ•˜๋Š” ์žฅ๊ธฐ์  ๋ฐ์ดํ„ฐ ์˜ค์—ผ ๋ฌธ์ œ๋ฅผ ์‹ฌ๋„ ์žˆ๊ฒŒ ๋‹ค๋ฃน๋‹ˆ๋‹ค. ํŠนํžˆ, ๋Œ€๊ทœ๋ชจ๋กœ ์ƒ์„ฑ๋œ ๋ชจ๋ธ ๋ฐ์ดํ„ฐ๊ฐ€ ์žฅ๊ธฐ์ ์œผ๋กœ ์–ด๋–ป๊ฒŒ ๋ฐ์ดํ„ฐ ๋ถ„ํฌ๋ฅผ ์˜ค์—ผ์‹œํ‚ค๊ณ  ๊ฒฐ๊ณผ์ ์œผ๋กœ ๋ชจ๋ธ ๋ถ•๊ดด๋ฅผ ์ด‰์ง„ํ•˜๋Š”์ง€ ์„ค๋ช…ํ•ฉ๋‹ˆ๋‹ค.

  1. ๋ฐ์ดํ„ฐ ์˜ค์—ผ์˜ ์˜ˆ

    • LLM๊ณผ ๊ฐ™์€ ์ž๋™ํ™”๋œ ์ƒ์„ฑํ˜• AI๋Š” ์ธ๊ฐ„์˜ ๊ฐœ์ž… ์—†์ด ๋Œ€๊ทœ๋ชจ ๋ฐ์ดํ„ฐ๋ฅผ ์ƒ์„ฑํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด์™€ ์œ ์‚ฌํ•œ ์ธ๊ฐ„ ์ฃผ๋„ ๋ฐ์ดํ„ฐ ์˜ค์—ผ์˜ ์˜ˆ๋กœ, ํด๋ฆญ ๋†์žฅ, ์ฝ˜ํ…์ธ  ๋†์žฅ, ํŠธ๋กค ๋†์žฅ ๋“ฑ์„ ๋“ค ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๋ฐ์ดํ„ฐ ์˜ค์—ผ์€ ์†Œ์…œ ๋ฏธ๋””์–ด๋‚˜ ๊ฒ€์ƒ‰ ์—”์ง„ ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ๊ต๋ž€์‹œํ‚ค๋Š” ๊ฒฐ๊ณผ๋ฅผ ๋‚ณ์•˜์Šต๋‹ˆ๋‹ค.
    • Google์€ ์ด๋ฅผ ๋ฐฉ์ง€ํ•˜๊ธฐ ์œ„ํ•ด ๊ต์œก๊ธฐ๊ด€ ๋„๋ฉ”์ธ๊ณผ ๊ฐ™์€ ์‹ ๋ขฐํ•  ์ˆ˜ ์žˆ๋Š” ์ถœ์ฒ˜์˜ ์ฝ˜ํ…์ธ ๋ฅผ ์šฐ์„ ์ ์œผ๋กœ ๋ฐฐ์น˜ํ•˜๋Š” ๋ฐฉ์‹์œผ๋กœ ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ๋ณ€๊ฒฝํ–ˆ๊ณ , DuckDuckGo๋Š” ์ด๋Ÿฌํ•œ ์ฝ˜ํ…์ธ ๋ฅผ ์™„์ „ํžˆ ์ œ๊ฑฐํ•˜๋Š” ๋ฐฉ์‹์œผ๋กœ ๋Œ€์‘ํ–ˆ์Šต๋‹ˆ๋‹ค.
  2. LLM์—์„œ์˜ ๋ฌธ์ œ ํ™•๋Œ€

    • ๊ทธ๋Ÿฌ๋‚˜ LLM์€ ์ธ๊ฐ„์˜ ๊ฐœ์ž… ์—†์ด ๋Œ€๊ทœ๋ชจ๋กœ ์ž๋™ํ™”๋œ ๋ฐฉ์‹์œผ๋กœ ๋ฐ์ดํ„ฐ๋ฅผ ์ƒ์„ฑํ•  ์ˆ˜ ์žˆ๊ธฐ ๋•Œ๋ฌธ์—, ๋ฐ์ดํ„ฐ ์˜ค์—ผ ๋ฌธ์ œ๊ฐ€ ํ›จ์”ฌ ๋” ์‹ฌ๊ฐํ•ด์งˆ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์‹œ๊ฐ„์ด ์ง€๋‚˜๋ฉด, LLM์ด ์ƒ์„ฑํ•œ ๋ฐ์ดํ„ฐ๊ฐ€ ์ธํ„ฐ๋„ท ์ƒ์—์„œ ์ ์  ๋” ํฐ ๋น„์œจ์„ ์ฐจ์ง€ํ•˜๊ฒŒ ๋˜์–ด, ๋ชจ๋ธ ๋ถ•๊ดด๊ฐ€ ๋”์šฑ ์‹ฌ๊ฐํ•ด์งˆ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
    • ๋ชจ๋ธ ๋ถ•๊ดด๋Š” ์ €ํ™•๋ฅ  ์‚ฌ๊ฑด์„ ์˜ˆ์ธกํ•˜๋Š” ๋Šฅ๋ ฅ์„ ์ €ํ•˜์‹œ์ผœ, ํŠนํžˆ ์†Œ์ˆ˜ ์ง‘๋‹จ์ด๋‚˜ ์ค‘์š”ํ•œ ์˜ˆ์™ธ์ ์ธ ์‚ฌ๊ฑด์„ ์ฒ˜๋ฆฌํ•˜๋Š” ๋ฐ ์‹ฌ๊ฐํ•œ ์˜ํ–ฅ์„ ๋ฏธ์น  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ์‚ฌ๊ฑด์„ ๋ฌด์‹œํ•˜๋Š” ๋ชจ๋ธ์€ ๋ถˆ๊ณต์ •ํ•˜๊ฑฐ๋‚˜ ์ž˜๋ชป๋œ ์˜ˆ์ธก์„ ํ•˜๊ฒŒ ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

โ€˜์„ ๋ฐœ์ž ์šฐ์œ„(First Mover Advantage)โ€™

  • ์—ฐ๊ตฌ๋Š” โ€˜์„ ๋ฐœ์ž ์šฐ์œ„(first mover advantage)โ€™ ๊ฐœ๋…์„ ๋„์ž…ํ•˜์—ฌ, ์ดˆ๊ธฐ ์„ธ๋Œ€์˜ ๋ชจ๋ธ์ด ์ค‘์š”ํ•˜๋‹ค๋Š” ์ ์„ ๊ฐ•์กฐํ•ฉ๋‹ˆ๋‹ค.
    • ์ดˆ๊ธฐ ์„ธ๋Œ€์˜ ๋ชจ๋ธ์ด ์ƒ์„ฑํ•œ ๋ฐ์ดํ„ฐ๋Š” ํ›„์† ๋ชจ๋ธ๋“ค์ด ํ•™์Šตํ•˜๋Š” ๋ฐ์ดํ„ฐ ๋ถ„ํฌ๋ฅผ ํฌ๊ฒŒ ์ขŒ์šฐํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋งŒ์•ฝ ์ดˆ๊ธฐ ๋ชจ๋ธ์ด ์ž˜๋ชป๋œ ๋ฐ์ดํ„ฐ ํŒจํ„ด์„ ํ•™์Šตํ•˜๊ณ  ์ด๋ฅผ ํ›„์† ๋ชจ๋ธ๋“ค์ด ๋ฐ˜๋ณตํ•ด์„œ ํ•™์Šตํ•˜๋ฉด, ์ ์ฐจ์ ์œผ๋กœ ๋” ์‹ฌ๊ฐํ•œ ๋ชจ๋ธ ๋ถ•๊ดด๊ฐ€ ๋ฐœ์ƒํ•˜๊ฒŒ ๋ฉ๋‹ˆ๋‹ค.
    • ๋”ฐ๋ผ์„œ, ์žฅ๊ธฐ์ ์ธ ํ•™์Šต์—์„œ ๋ชจ๋ธ์ด ๋ถ•๊ดดํ•˜์ง€ ์•Š๊ธฐ ์œ„ํ•ด์„œ๋Š” ์›๋ณธ ๋ฐ์ดํ„ฐ์— ์ง€์†์ ์œผ๋กœ ์ ‘๊ทผํ•  ์ˆ˜ ์žˆ์–ด์•ผ ํ•˜๋ฉฐ, LLM์ด ์ƒ์„ฑํ•œ ๋ฐ์ดํ„ฐ๋ฅผ ๋‹ค๋ฅธ ๋ฐ์ดํ„ฐ์™€ ๊ตฌ๋ณ„ํ•˜๋Š” ๋ฉ”์ปค๋‹ˆ์ฆ˜์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค.

๋ฐ์ดํ„ฐ ์›๋ณธ ๋ฌธ์ œ

  • ์ธํ„ฐ๋„ท์—์„œ ์ˆ˜์ง‘ํ•œ ๋ฐ์ดํ„ฐ ์ค‘ LLM์ด ์ƒ์„ฑํ•œ ๋ฐ์ดํ„ฐ์™€ ์‹ค์ œ ์ธ๊ฐ„์ด ์ƒ์„ฑํ•œ ๋ฐ์ดํ„ฐ๋ฅผ ๊ตฌ๋ถ„ํ•˜๋Š” ๋ฌธ์ œ๋Š” ๋งค์šฐ ์–ด๋ ค์šด ๊ณผ์ œ์ž…๋‹ˆ๋‹ค. ๋Œ€๊ทœ๋ชจ ์›น ๋ฐ์ดํ„ฐ๋ฅผ ํ•™์Šต์— ์‚ฌ์šฉํ•˜๊ธฐ ์œ„ํ•ด์„œ๋Š” ๊ฐ ๋ฐ์ดํ„ฐ์˜ ์ถœ์ฒ˜๋ฅผ ๋ช…ํ™•ํžˆ ๊ตฌ๋ถ„ํ•  ์ˆ˜ ์žˆ์–ด์•ผ ํ•˜๋ฉฐ, ๊ทธ๋ ‡์ง€ ์•Š์œผ๋ฉด ๋ชจ๋ธ ๋ถ•๊ดด๊ฐ€ ๊ฐ€์†ํ™”๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
  • ์—ฐ๊ตฌํŒ€์€ ๋ฐ์ดํ„ฐ ์ถœ์ฒ˜ ๊ด€๋ฆฌ์˜ ์ค‘์š”์„ฑ์„ ๊ฐ•์กฐํ•˜๋ฉฐ, LLM์ด ๋Œ€๊ทœ๋ชจ๋กœ ์ƒ์„ฑ๋œ ๋ฐ์ดํ„ฐ๋ฅผ ํ•™์Šตํ•˜์ง€ ์•Š๋„๋ก ํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค. ์ด๋ฅผ ์œ„ํ•ด์„œ๋Š” ์ปค๋ฎค๋‹ˆํ‹ฐ ์ฐจ์›์˜ ํ˜‘๋ ฅ์ด ํ•„์š”ํ•˜๋ฉฐ, ์ธํ„ฐ๋„ท ์ƒ์—์„œ ํฌ๋กค๋ง๋œ ๋ฐ์ดํ„ฐ์˜ ์ถœ์ฒ˜์™€ ์‹ ๋ขฐ์„ฑ์„ ๊ด€๋ฆฌํ•  ์ˆ˜ ์žˆ๋Š” ์‹œ์Šคํ…œ์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค.

๐Ÿค” ์„œ์ฟ  ์˜๊ฒฌ : ๊ณต๊ฐ๋˜๋Š” ๋ถ€๋ถ„์ด ๋งŽ์€ ๋…ผ๋ฌธ์ด๊ธด ํ•˜๋‚˜, ์‹ค์ œ๋กœ ๊ฑฐ๋Œ€ํ•œ ์–ธ์–ด๋ชจ๋ธ(Ex. Gemini๋‚˜, GPTs)์—๋„ ๋™์ผํ•˜๊ฒŒ ์ž‘๋™ํ• ์ง€ ๊ถ๊ธˆํ•˜๋„ค์š”.

  • ํ•˜์ง€๋งŒ, ์ €๋Ÿฐ big tech company๋“ค์ด ํ•˜๋“ฏ์ด ์–ด๋А ์ •๋„์˜ ๋ฐ์ดํ„ฐ ์ •์ œ๊ฐ€ ํ•„์ˆ˜์ ์ด๋ผ๋Š” ๋ถ€๋ถ„์€ ๋งค์šฐ ๊ณต๊ฐํ•˜๋Š” ๋ถ€๋ถ„์ž…๋‹ˆ๋‹ค.
  • ๋ถ„์„๊ฐ€ ๋˜๋Š” ์‚ฌ์ด์–ธํ‹ฐ์ŠคํŠธ๋“ค์ด ๋Š˜ ํ•˜๋Š” ๋ง, โ€œTrash in Trash outโ€์ฒ˜๋Ÿผ ๊ฒฐ๊ตญ ํ•™์Šต์— ์‚ฌ์šฉ๋˜๋Š” ๋ฐ์ดํ„ฐ ํ€„๋ฆฌํ‹ฐ๊ฐ€ ์ข‹์•„์•ผ ํ•™์Šต๋˜๋Š” ๋ชจ๋ธ ์ž์ฒด๋„ ์˜๋ฏธ๊ฐ€ ์žˆ๋Š” ๊ฒƒ์ด๋‹ˆ๊นŒ์š”.

AI produces gibberish when trained on too much AI-generated data

(๋ฒˆ์—ญ) AI๊ฐ€ AI ๋ฐ์ดํ„ฐ๋ฅผ ํ•™์Šตํ•  ๋•Œ ๋ฐœ์ƒํ•˜๋Š” ๋ฌธ์ œ: ๋ง์ด ๋˜์ง€ ์•Š๋Š” ๊ฒฐ๊ณผ๋ฌผ

๋‘ ๋ฒˆ์งธ ๋…ผ๋ฌธ, โ€œAI produces gibberish when trained on too much AI-generated dataโ€๋Š” AI๊ฐ€ ์ƒ์„ฑํ•œ ์ฝ˜ํ…์ธ ๊ฐ€ ๋‹ค์‹œ AI ๋ชจ๋ธ์˜ ํ•™์Šต ๋ฐ์ดํ„ฐ๋กœ ์‚ฌ์šฉ๋  ๋•Œ, ์ด๋กœ ์ธํ•ด ๋ฐœ์ƒํ•˜๋Š” ๋ฌธ์ œ์ ๊ณผ ๊ทธ ์˜ํ–ฅ์— ๋Œ€ํ•ด ๋‹ค๋ฃน๋‹ˆ๋‹ค.

  • ํŠนํžˆ AI ์ƒ์„ฑ ์ฝ˜ํ…์ธ ๊ฐ€ ์ธํ„ฐ๋„ท์— ํ™•์‚ฐ๋จ์— ๋”ฐ๋ผ, ์ด๋Ÿฌํ•œ ์ฝ˜ํ…์ธ ๊ฐ€ AI ๋ชจ๋ธ์˜ ํ•™์Šต ๋ฐ์ดํ„ฐ๋กœ ํฌํ•จ๋  ๊ฒฝ์šฐ ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ์ด ์–ด๋–ป๊ฒŒ ์ €ํ•˜๋  ์ˆ˜ ์žˆ๋Š”์ง€๋ฅผ ํƒ๊ตฌํ•ฉ๋‹ˆ๋‹ค.

1. AI ์ƒ์„ฑ ์ฝ˜ํ…์ธ ์˜ ์ฆ๊ฐ€์™€ ๊ทธ ๋ฌธ์ œ์ 

  • AI ์ƒ์„ฑ ์ฝ˜ํ…์ธ (์˜ˆ: ๋ธ”๋กœ๊ทธ, ์ด๋ฏธ์ง€ ๋“ฑ)๊ฐ€ ์ธํ„ฐ๋„ท ์ƒ์—์„œ ๊ธ‰๊ฒฉํžˆ ์ฆ๊ฐ€ํ•˜๊ณ  ์žˆ์œผ๋ฉฐ, ์ด๋Š” ์ ์  ๋” ํ”ํ•ด์ง€๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.
  • ๊ทธ๋Ÿฌ๋‚˜ ์ด AI ์ƒ์„ฑ ์ฝ˜ํ…์ธ ๊ฐ€ ๋‹ค์‹œ AI ๋ชจ๋ธ์˜ ํ•™์Šต ๋ฐ์ดํ„ฐ๋กœ ์‚ฌ์šฉ๋  ๋•Œ, ๊ทธ ๋ชจ๋ธ์— ์‹ฌ๊ฐํ•œ ์˜ํ–ฅ์„ ๋ฏธ์น  ์ˆ˜ ์žˆ๋‹ค๋Š” ์—ฐ๊ตฌ ๊ฒฐ๊ณผ๊ฐ€ ๋‚˜์™”์Šต๋‹ˆ๋‹ค.

2. AI ๋ชจ๋ธ์˜ โ€˜๋ชจ๋ธ ๋ถ•๊ดดโ€™ ๋ฌธ์ œ

AI ๋ชจ๋ธ์€ ์ธํ„ฐ๋„ท์— ์žˆ๋Š” ๋ฐฉ๋Œ€ํ•œ ์–‘์˜ ๋ฐ์ดํ„ฐ๋ฅผ ํ•™์Šตํ•˜์—ฌ ํŒจํ„ด์„ ์ถ”์ถœํ•˜๊ณ , ์ด๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ํ˜„์‹ค๊ณผ ์œ ์‚ฌํ•œ ์ฝ˜ํ…์ธ ๋ฅผ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค.

  • ๊ทธ๋Ÿฌ๋‚˜ ๋ฌธ์ œ๋Š” ์ด ๋ฐ์ดํ„ฐ๊ฐ€ ์ ์ฐจ AI๊ฐ€ ์ƒ์„ฑํ•œ ๋ฐ์ดํ„ฐ๋กœ ์ฑ„์›Œ์งˆ ๋•Œ ๋ฐœ์ƒํ•ฉ๋‹ˆ๋‹ค.
  • ์—ฐ๊ตฌ์— ๋”ฐ๋ฅด๋ฉด AI ๋ชจ๋ธ์ด ์ž๊ธฐ ์ž์‹ ์˜ ์ƒ์„ฑ๋ฌผ๋กœ ํ•™์Šตํ•  ๊ฒฝ์šฐ, ๊ทธ ๋ชจ๋ธ์ด ์ ์ฐจ ๋ถ•๊ดดํ•œ๋‹ค๋Š” ๊ฒฐ๊ณผ๋ฅผ ๋ณด์˜€์Šต๋‹ˆ๋‹ค. (์•„๋ž˜ ๊ทธ๋ฆผ ์ฐธ๊ณ )

    • ์˜ˆ๋ฅผ ๋“ค์–ด, AI๊ฐ€ ๊ฐœ ์‚ฌ์ง„์„ ์ƒ์„ฑํ•˜๋Š” ๋ชจ๋ธ์„ ์ƒ๊ฐํ•ด๋ณด๋ฉด, ์ด ๋ชจ๋ธ์€ ์‹ค์ œ ์ด๋ฏธ์ง€ ๋ฐ์ดํ„ฐ์—์„œ ์ž์ฃผ ๋‚˜ํƒ€๋‚˜๋Š” ๊ฐœ ํ’ˆ์ข…(์˜ˆ: ๊ณจ๋“  ๋ฆฌํŠธ๋ฆฌ๋ฒ„)์„ ๋” ๋งŽ์ด ํ•™์Šตํ•˜๊ฒŒ ๋ฉ๋‹ˆ๋‹ค.
    • ์‹œ๊ฐ„์ด ์ง€๋‚˜๋ฉด AI๋Š” ํ”ํ•˜์ง€ ์•Š์€ ํ’ˆ์ข…(์˜ˆ: ํ”„๋ Œ์น˜ ๋ถˆ๋…, ๋‹ฌ๋งˆ์‹œ์•ˆ ๋“ฑ)์„ ์žŠ์–ด๋ฒ„๋ฆฌ๊ณ , ๊ฒฐ๊ตญ์€ ํ”ํ•œ ํ’ˆ์ข…๋งŒ ์ƒ์„ฑํ•˜๊ฒŒ ๋ฉ๋‹ˆ๋‹ค. ์ด๋ฅผ ๋ฐ˜๋ณตํ•˜๋ฉด ๋ชจ๋ธ์€ ๋” ์ด์ƒ ์œ ํšจํ•œ ์ฝ˜ํ…์ธ ๋ฅผ ์ƒ์„ฑํ•˜์ง€ ๋ชปํ•˜๊ฒŒ ๋ฉ๋‹ˆ๋‹ค.

์œ„ Figure1 ๊ทธ๋ฆผ์€ AI ๋ชจ๋ธ์ด ์Šค์Šค๋กœ ์ƒ์„ฑํ•œ ๋ฐ์ดํ„ฐ๋กœ ๋‹ค์‹œ ํ•™์Šตํ•  ๋•Œ ๋ฐœ์ƒํ•˜๋Š” ๋ฌธ์ œ, ์ฆ‰ ๋ชจ๋ธ ๋ถ•๊ดด์— ๋Œ€ํ•œ ๊ณผ์ •์„ ์„ค๋ช…ํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ๋‹ค์Œ์€ ๊ฐ ํŒจ๋„์˜ ์„ค๋ช…์ž…๋‹ˆ๋‹ค.

a) ์‹ค์ œ ์ด๋ฏธ์ง€์— ์žˆ๋Š” ๊ฐœ ํ’ˆ์ข…๋“ค ๊ธฐ๋ฐ˜ ํ•™์Šต

  • ์ฒซ ๋ฒˆ์งธ ํŒจ๋„(a)์—์„œ๋Š” ์‹ค์ œ ๋ฐ์ดํ„ฐ์—์„œ AI ๋ชจ๋ธ์ด ํ•™์Šตํ•˜๋Š” ๊ฐœ ํ’ˆ์ข…๋“ค์ด ๋‚˜์—ด๋˜์–ด ์žˆ์Šต๋‹ˆ๋‹ค. ์—ฌ๊ธฐ์—๋Š” ์›ฐ์‹œ์ฝ”๊ธฐ, ํ”„ํ‹ฐ ๋ฐ”์„ธ ๊ทธ๋ฆฌํ ๋ฐฉ๋Œ•, ๋‹ฌ๋งˆ์‹œ์•ˆ, ํ”„๋ Œ์น˜ ๋ถˆ๋…, ๊ณจ๋“  ๋ฆฌํŠธ๋ฆฌ๋ฒ„๊ฐ€ ํฌํ•จ๋˜์–ด ์žˆ์Šต๋‹ˆ๋‹ค.
  • ์ด ๋ชจ๋ธ์€ ์‹ค์ œ๋กœ ์กด์žฌํ•˜๋Š” ์ด๋ฏธ์ง€๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๊ฐ ํ’ˆ์ข…์˜ ํŠน์„ฑ์„ ํ•™์Šตํ•ฉ๋‹ˆ๋‹ค.

b) AI๊ฐ€ ์‹ค์ œ ์ด๋ฏธ์ง€๋กœ ํ•™์Šตํ–ˆ์„ ๋•Œ ์ƒ์„ฑ๋œ ์ด๋ฏธ์ง€

  • ๋‘ ๋ฒˆ์งธ ํŒจ๋„(b)์—์„œ๋Š” AI ๋ชจ๋ธ์ด ์‹ค์ œ ์ด๋ฏธ์ง€๋กœ ํ•™์Šตํ•œ ํ›„ ๊ฐœ ์ด๋ฏธ์ง€๋ฅผ ์ƒ์„ฑํ•œ ๊ฒฐ๊ณผ๋ฅผ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
  • ์ด๋•Œ AI๋Š” ๊ณจ๋“  ๋ฆฌํŠธ๋ฆฌ๋ฒ„์™€ ๊ฐ™์€ ํ”ํ•œ ํ’ˆ์ข…์„ ๋” ์ž์ฃผ ์ƒ์„ฑํ•˜๊ณ , ๋œ ํ”ํ•œ ํ’ˆ์ข…(์˜ˆ: ํ”„๋ Œ์น˜ ๋ถˆ๋…, ํ”„ํ‹ฐ ๋ฐ”์„ธ ๊ทธ๋ฆฌํ ๋ฐฉ๋Œ•)์€ ์ƒ๋Œ€์ ์œผ๋กœ ์ ๊ฒŒ ์ƒ์„ฑํ•˜๊ฒŒ ๋ฉ๋‹ˆ๋‹ค.

c) AI ์ƒ์„ฑ ๋ฐ์ดํ„ฐ๋ฅผ ๋‹ค์‹œ ํ•™์Šตํ–ˆ์„ ๋•Œ์˜ ๊ฒฐ๊ณผ

  • ์„ธ ๋ฒˆ์งธ ํŒจ๋„(c)์—์„œ๋Š” AI ๋ชจ๋ธ์ด ์ž์‹ ์ด ์ƒ์„ฑํ•œ ์ด๋ฏธ์ง€๋กœ ๋‹ค์‹œ ํ•™์Šตํ•œ ๊ฒฐ๊ณผ๋ฅผ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
  • ์ด ๊ฒฝ์šฐ, AI๋Š” ์›๋ž˜ ํ•™์Šตํ•œ ๋ฐ์ดํ„ฐ์—์„œ ์ž์ฃผ ๋“ฑ์žฅํ•œ ํ’ˆ์ข…(์˜ˆ: ๊ณจ๋“  ๋ฆฌํŠธ๋ฆฌ๋ฒ„)๋งŒ์„ ๋”์šฑ ๋งŽ์ด ์ƒ์„ฑํ•˜๊ณ , ๋œ ํ”ํ•œ ํ’ˆ์ข…๋“ค์€ ์ ์  ์žŠํ˜€์ง‘๋‹ˆ๋‹ค.
  • ๊ฒฐ๊ณผ์ ์œผ๋กœ ๊ณจ๋“  ๋ฆฌํŠธ๋ฆฌ๋ฒ„์™€ ๊ฐ™์€ ํ”ํ•œ ํ’ˆ์ข…์˜ ๋น„์œจ์ด ๋”์šฑ ๋†’์•„์ง‘๋‹ˆ๋‹ค.

d) ๋ชจ๋ธ ๋ถ•๊ดด

  • ๋„ค ๋ฒˆ์งธ ํŒจ๋„(d)์—์„œ๋Š” ์—ฌ๋Ÿฌ ๋ฒˆ์˜ ํ•™์Šต ์ฃผ๊ธฐ๋ฅผ ๊ฑฐ์นœ ํ›„ AI ๋ชจ๋ธ์ด ๋ชจ๋ธ ๋ถ•๊ดด๋ฅผ ๊ฒช๋Š” ๊ณผ์ •์„ ์„ค๋ช…ํ•ฉ๋‹ˆ๋‹ค.
  • ๋ฐ˜๋ณต์ ์ธ ์ž๊ธฐ ํ•™์Šต์„ ํ†ตํ•ด AI ๋ชจ๋ธ์€ ๊ฒฐ๊ตญ ์˜๋ฏธ ์—†๋Š” ์ถœ๋ ฅ, ์ฆ‰ ์‹ค์ œ๋กœ ์กด์žฌํ•˜์ง€ ์•Š๋Š” ์™œ๊ณก๋œ ์ด๋ฏธ์ง€๋‚˜ ๋ฐ์ดํ„ฐ๋งŒ ์ƒ์„ฑํ•˜๊ฒŒ ๋ฉ๋‹ˆ๋‹ค.

3. ๋ชจ๋ธ ๋ถ•๊ดด์˜ ๊ณต์ •์„ฑ ๋ฌธ์ œ

๋ชจ๋ธ ๋ถ•๊ดด๋Š” ๋‹จ์ˆœํžˆ AI ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ ์ €ํ•˜ ๋ฌธ์ œ๋ฅผ ๋„˜์–ด์„œ ๊ณต์ •์„ฑ์—๋„ ์‹ฌ๊ฐํ•œ ์˜ํ–ฅ์„ ๋ฏธ์น  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๊ตฌ์ฒด์ ์œผ๋กœ ์„ค๋ช…ํ•˜์ž๋ฉด, AI ๋ชจ๋ธ์ด ๋ฐ˜๋ณต์ ์œผ๋กœ ์ž๊ธฐ ์ž์‹ ์˜ ๋ฐ์ดํ„ฐ๋ฅผ ํ•™์Šตํ•˜๊ฒŒ ๋  ๊ฒฝ์šฐ, ๋œ ์ผ๋ฐ˜์ ์ธ ๋ฐ์ดํ„ฐ๋‚˜ ์†Œ์ˆ˜ ๊ทธ๋ฃน์˜ ๋ฐ์ดํ„ฐ๊ฐ€ ์ œ๋Œ€๋กœ ํ•™์Šต๋˜์ง€ ์•Š์„ ๊ฐ€๋Šฅ์„ฑ์ด ์ปค์ง‘๋‹ˆ๋‹ค.

  • ์˜ˆ๋ฅผ ๋“ค์–ด, ๋Œ€๋‹ค์ˆ˜์˜ ์‚ฌ๋žŒ๋“ค์ด ์ž์ฃผ ์‚ฌ์šฉํ•˜๋Š” ์–ธ์–ด๋‚˜ ํ‘œํ˜„๋งŒ์„ ๋ฐ˜๋ณต์ ์œผ๋กœ ํ•™์Šตํ•˜๊ฒŒ ๋œ๋‹ค๋ฉด, ์†Œ์ˆ˜ ์ง‘๋‹จ์ด ์‚ฌ์šฉํ•˜๋Š” ํŠน์œ ์˜ ์–ธ์–ด๋‚˜ ๋ฌธํ™”์ ์ธ ํ‘œํ˜„์€ ๋ฌด์‹œ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋กœ ์ธํ•ด AI ๋ชจ๋ธ์€ ์†Œ์ˆ˜ ๊ทธ๋ฃน์˜ ์–ธ์–ด๋‚˜ ๊ด€์ ์„ ์ž˜ ๋ฐ˜์˜ํ•˜์ง€ ๋ชปํ•˜๊ฒŒ ๋˜๊ณ , ์ด๋Š” ์‚ฌํšŒ์  ๊ณต์ •์„ฑ์— ๋ฌธ์ œ๋ฅผ ์ผ์œผํ‚ฌ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
  • ํŠนํžˆ, AI ๋ชจ๋ธ์ด ์†Œ์ˆ˜ ๊ทธ๋ฃน์„ ๋Œ€๋ณ€ํ•˜๋Š” ์ค‘์š”ํ•œ ๊ฐœ๋…์ด๋‚˜ ํ‘œํ˜„์„ ์ดํ•ดํ•˜๊ฑฐ๋‚˜ ์ƒ์„ฑํ•˜์ง€ ๋ชปํ•˜๊ฒŒ ๋  ์ˆ˜ ์žˆ์œผ๋ฉฐ, ์ด๋Š” AI๊ฐ€ ์ƒ์„ฑํ•˜๋Š” ์ฝ˜ํ…์ธ ์—์„œ ํŽธํ–ฅ์ด๋‚˜ ์ฐจ๋ณ„์„ ๋ฐœ์ƒ์‹œํ‚ฌ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
  • ๋”ฐ๋ผ์„œ, AI ๋ชจ๋ธ์ด ๋ฐ์ดํ„ฐ๋ฅผ ํ•™์Šตํ•  ๋•Œ ๋‹ค์–‘ํ•œ ์‚ฌํšŒ์  ๋ฐฐ๊ฒฝ๊ณผ ๋ฌธํ™”์  ํ‘œํ˜„์„ ์ ์ ˆํžˆ ๋ฐ˜์˜ํ•  ์ˆ˜ ์žˆ๋„๋ก ํ•ด์•ผ ํ•œ๋‹ค๋Š” ๋ฌธ์ œ๊ฐ€ ์ œ๊ธฐ๋ฉ๋‹ˆ๋‹ค.

4. ๋ฌธ์ œ ํ•ด๊ฒฐ ๋ฐฉ์•ˆ

์ด๋Ÿฌํ•œ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•œ ๋ฐฉ๋ฒ• ์ค‘ ํ•˜๋‚˜๋กœ ์›Œํ„ฐ๋งˆํฌ์˜ ์‚ฌ์šฉ์ด ์ œ์•ˆ๋ฉ๋‹ˆ๋‹ค.

  • ์›Œํ„ฐ๋งˆํฌ๋Š” AI๊ฐ€ ์ƒ์„ฑํ•œ ์ฝ˜ํ…์ธ ์— ์ถ”๊ฐ€๋˜๋Š” ๋ณด์ด์ง€ ์•Š๋Š” ์‹ ํ˜ธ๋กœ, AI ๋ชจ๋ธ์ด ์ด๋Ÿฌํ•œ ์‹ ํ˜ธ๋ฅผ ํƒ์ง€ํ•˜์—ฌ AI ์ƒ์„ฑ ์ฝ˜ํ…์ธ ๋ฅผ ๊ตฌ๋ถ„ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋ ‡๊ฒŒ ํ•จ์œผ๋กœ์จ, AI ์ƒ์„ฑ ์ฝ˜ํ…์ธ ๊ฐ€ ํ•™์Šต ๋ฐ์ดํ„ฐ์—์„œ ์ž๋™์œผ๋กœ ์ œ๊ฑฐ๋˜๊ฑฐ๋‚˜ ์ตœ์†Œํ•œ ํ‘œ์‹œ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
  • ์˜ˆ๋ฅผ ๋“ค์–ด, ์ด๋ฏธ์ง€๋‚˜ ํ…์ŠคํŠธ ๋ฐ์ดํ„ฐ์— ์›Œํ„ฐ๋งˆํฌ๋ฅผ ์‚ฝ์ž…ํ•˜์—ฌ AI๊ฐ€ ์ด ๋ฐ์ดํ„ฐ๋ฅผ ํ•™์Šตํ•  ๋•Œ โ€œ์ด ๋ฐ์ดํ„ฐ๋Š” ์ด๋ฏธ AI๊ฐ€ ์ƒ์„ฑํ•œ ๊ฒƒ์ด๋‹คโ€๋ผ๋Š” ์‚ฌ์‹ค์„ ์•Œ ์ˆ˜ ์žˆ๋„๋ก ํ•˜๋Š” ๋ฐฉ์‹์ž…๋‹ˆ๋‹ค.

๊ทธ๋Ÿฌ๋‚˜, ์›Œํ„ฐ๋งˆํฌ ๋ฐฉ์‹์—๋„ ํ•œ๊ณ„๊ฐ€ ์กด์žฌํ•ฉ๋‹ˆ๋‹ค:

  • ์›Œํ„ฐ๋งˆํฌ๋Š” ์‰ฝ๊ฒŒ ์ œ๊ฑฐ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์•…์˜์ ์ธ ๋ชฉ์ ์„ ๊ฐ€์ง„ ์‚ฌ๋žŒ๋“ค์ด ์›Œํ„ฐ๋งˆํฌ๋ฅผ ์‚ญ์ œํ•˜๊ฑฐ๋‚˜ ๋ณ€ํ˜•ํ•จ์œผ๋กœ์จ AI ์ƒ์„ฑ ๋ฐ์ดํ„ฐ๋ฅผ ๋‹ค์‹œ ํ•™์Šต์— ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๊ฒŒ ๋งŒ๋“ค ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
  • ๋˜ํ•œ, AI ๊ธฐ์—… ๊ฐ„์˜ ํ˜‘๋ ฅ์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค. AI ๋ชจ๋ธ์„ ๊ฐœ๋ฐœํ•˜๋Š” ๋ชจ๋“  ๊ธฐ์—…์ด ๋™์ผํ•œ ์›Œํ„ฐ๋งˆํฌ ์‹œ์Šคํ…œ์„ ์‚ฌ์šฉํ•˜๊ณ  ์ •๋ณด๋ฅผ ๊ณต์œ ํ•ด์•ผ ํ•˜์ง€๋งŒ, ์ด๋Š” ์ƒ์—…์ ์ธ ์ด์ต์ด๋‚˜ ๊ฒฝ์Ÿ ๊ตฌ๋„ ๋•Œ๋ฌธ์— ํ˜„์‹ค์ ์œผ๋กœ ์–ด๋ ค์šธ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ํ•œ ๊ธฐ์—…์ด ์ž์‹ ์˜ ์›Œํ„ฐ๋งˆํฌ ์ •๋ณด๋ฅผ ๊ณต์œ ํ•˜์ง€ ์•Š์œผ๋ฉด, ๋‹ค๋ฅธ ๊ธฐ์—…์˜ AI ๋ชจ๋ธ์ด ๊ทธ ๋ฐ์ดํ„ฐ๋ฅผ ํ•™์Šตํ•˜๊ฒŒ ๋  ์œ„ํ—˜์ด ์กด์žฌํ•ฉ๋‹ˆ๋‹ค.

5. ๋ชจ๋ธ ๋ถ•๊ดด์˜ ํ™•์žฅ ๊ฐ€๋Šฅ์„ฑ

์ด ์—ฐ๊ตฌ๋Š” ์ฃผ๋กœ ํ…์ŠคํŠธ ์ƒ์„ฑ ๋ชจ๋ธ์„ ๋Œ€์ƒ์œผ๋กœ ํ–ˆ์ง€๋งŒ, ์ด ํ˜„์ƒ์€ ์ด๋ฏธ์ง€ ์ƒ์„ฑ ๋ชจ๋ธ, ์Œ์„ฑ ์ƒ์„ฑ ๋ชจ๋ธ, ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๋ชจ๋ธ(์—ฌ๋Ÿฌ ํ˜•ํƒœ์˜ ๋ฐ์ดํ„ฐ๋ฅผ ๋™์‹œ์— ์ฒ˜๋ฆฌํ•˜๋Š” ๋ชจ๋ธ) ๋“ฑ ๋‹ค์–‘ํ•œ ์œ ํ˜•์˜ AI ๋ชจ๋ธ์—์„œ ๋™์ผํ•˜๊ฒŒ ๋ฐœ์ƒํ•  ์ˆ˜ ์žˆ๋‹ค๋Š” ์ ์ด ์ค‘์š”ํ•ฉ๋‹ˆ๋‹ค.

  • ์˜ˆ๋ฅผ ๋“ค์–ด, ์ด๋ฏธ์ง€ ์ƒ์„ฑ ๋ชจ๋ธ์—์„œ๋„ AI๊ฐ€ ์ž์‹ ์ด ์ƒ์„ฑํ•œ ์ด๋ฏธ์ง€๋ฅผ ๋ฐ˜๋ณตํ•ด์„œ ํ•™์Šตํ•  ๊ฒฝ์šฐ, ๋ชจ๋ธ์ด ๋” ์ด์ƒ ์ƒˆ๋กœ์šด ์ด๋ฏธ์ง€๋ฅผ ์ƒ์„ฑํ•˜์ง€ ๋ชปํ•˜๊ณ  ์™œ๊ณก๋œ ์ด๋ฏธ์ง€๋‚˜ ์˜ค๋ฅ˜๊ฐ€ ํฌํ•จ๋œ ์ด๋ฏธ์ง€๋ฅผ ์ƒ์„ฑํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
  • AI๊ฐ€ ์ƒ์„ฑํ•œ ํ…์ŠคํŠธ์™€ ์ด๋ฏธ์ง€๋ฅผ ๋™์‹œ์— ํ•™์Šตํ•˜๋Š” ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๋ชจ๋ธ ์—ญ์‹œ ์ด๋Ÿฌํ•œ ๋ฌธ์ œ์— ์ง๋ฉดํ•  ๊ฐ€๋Šฅ์„ฑ์ด ํฝ๋‹ˆ๋‹ค.

๋”ฐ๋ผ์„œ ํ…์ŠคํŠธ ์™ธ์˜ ๋‹ค๋ฅธ ์ข…๋ฅ˜์˜ AI ๋ชจ๋ธ์—์„œ ๋ชจ๋ธ ๋ถ•๊ดด ํ˜„์ƒ์ด ์ผ์–ด๋‚˜๋Š”์ง€, ๊ทธ ์›์ธ์€ ๋ฌด์—‡์ธ์ง€์— ๋Œ€ํ•œ ์ถ”๊ฐ€ ์—ฐ๊ตฌ๊ฐ€ ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค.

6. ์ตœ์ดˆ ์ง„์ž…์ž์˜ ์ด์ 

AI ๋ชจ๋ธ์˜ ๋ถ•๊ดด ๋ฌธ์ œ๋Š” ๋˜ํ•œ ์ตœ์ดˆ ์ง„์ž…์ž ์ด์ (first-mover advantage)์„ ์‹œ์‚ฌํ•ฉ๋‹ˆ๋‹ค. ์ด๋Š” ์ดˆ๊ธฐ ๋‹จ๊ณ„์—์„œ ์ธ๊ฐ„์ด ๋งŒ๋“  ๋ฐ์ดํ„ฐ๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ AI ๋ชจ๋ธ์„ ๊ตฌ์ถ•ํ•œ ๊ธฐ์—…๋“ค์ด ๋‚˜์ค‘์— ๋“ฑ์žฅํ•œ ๊ธฐ์—…๋“ค์— ๋น„ํ•ด ๋” ์œ ๋ฆฌํ•œ ์œ„์น˜์— ์žˆ์„ ์ˆ˜ ์žˆ๋‹ค๋Š” ๊ฒƒ์„ ์˜๋ฏธํ•ฉ๋‹ˆ๋‹ค.

  • ์ดˆ๊ธฐ AI ๋ชจ๋ธ๋“ค์€ ์ธํ„ฐ๋„ท์— ์กด์žฌํ•˜๋Š” ์ธ๊ฐ„์ด ์ƒ์„ฑํ•œ ๋ฐ์ดํ„ฐ๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•™์Šตํ–ˆ๊ธฐ ๋•Œ๋ฌธ์—, ๋” ํ˜„์‹ค์ ์ด๊ณ  ๋ณต์žกํ•œ ์„ธ๊ณ„๋ฅผ ๋ฐ˜์˜ํ•  ์ˆ˜ ์žˆ๋Š” ๋ชจ๋ธ์„ ๊ตฌ์ถ•ํ•  ๊ฐ€๋Šฅ์„ฑ์ด ํฝ๋‹ˆ๋‹ค.
  • ๋ฐ˜๋ฉด, ์‹œ๊ฐ„์ด ์ง€๋‚˜๋ฉด์„œ ์ธํ„ฐ๋„ท์— AI๊ฐ€ ์ƒ์„ฑํ•œ ์ฝ˜ํ…์ธ ์˜ ๋น„์ค‘์ด ์ ์  ๋” ์ปค์ง€๋ฉด, ๋‚˜์ค‘์— ๋“ฑ์žฅํ•œ AI ๋ชจ๋ธ๋“ค์€ ์ด๋Ÿฌํ•œ AI ์ƒ์„ฑ ๋ฐ์ดํ„ฐ๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•™์Šตํ•˜๊ฒŒ ๋˜๊ณ , ์ด๋Š” ๋ชจ๋ธ ๋ถ•๊ดด์˜ ์œ„ํ—˜์„ ๋†’์ผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

๋”ฐ๋ผ์„œ, ์ดˆ๊ธฐ ๋ชจ๋ธ์„ ๊ตฌ์ถ•ํ•œ ๊ธฐ์—…๋“ค์€ ๋” ๋‚˜์€ ํ’ˆ์งˆ์˜ AI ๋ชจ๋ธ์„ ๊ฐ–์ถœ ์ˆ˜ ์žˆ์œผ๋ฉฐ, ์ด๋Š” AI ์‚ฐ์—…์—์„œ ์ค‘์š”ํ•œ ๊ฒฝ์Ÿ๋ ฅ์ด ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด ํ˜„์ƒ์€ AI ๊ธฐ์ˆ ์ด ๋ฐœ์ „ํ•จ์— ๋”ฐ๋ผ ๋” ๋ช…ํ™•ํ•˜๊ฒŒ ๋“œ๋Ÿฌ๋‚  ๊ฐ€๋Šฅ์„ฑ์ด ํฝ๋‹ˆ๋‹ค.

์—ฌ๋Ÿฌ๋ถ„๋“ค์˜ ์ƒ๊ฐ์€?

์ด ๋‘ ๋…ผ๋ฌธ์„ ํ†ตํ•ด, AI ๊ธฐ์ˆ ์˜ ๋ฐœ์ „์ด ๊ฐ€์ ธ์˜ฌ ์ˆ˜ ์žˆ๋Š” ์œ„ํ—˜์— ๋Œ€ํ•ด ๋‹ค์‹œ ํ•œ๋ฒˆ ์ƒ๊ฐํ•˜๊ฒŒ ๋ฉ๋‹ˆ๋‹ค. AI๊ฐ€ ์ƒ์„ฑํ•œ ๋ฐ์ดํ„ฐ๋ฅผ ๋ฐ˜๋ณต์ ์œผ๋กœ ํ•™์Šตํ•˜๊ฒŒ ๋  ๋•Œ ๋ฐœ์ƒํ•˜๋Š” ๋ฌธ์ œ๋Š” ๋‹จ์ˆœํ•œ ์„ฑ๋Šฅ ์ €ํ•˜๋ฅผ ๋„˜์–ด์„œ, AI ๋ชจ๋ธ ์ž์ฒด๊ฐ€ ํ˜„์‹ค์„ ์™œ๊ณกํ•˜๊ณ , ๋‹ค์–‘ํ•œ ๋ชฉ์†Œ๋ฆฌ๋ฅผ ๋ฐ˜์˜ํ•˜์ง€ ๋ชปํ•˜๊ฒŒ ๋งŒ๋“œ๋Š” ์‹ฌ๊ฐํ•œ ๊ฒฐ๊ณผ๋ฅผ ์ดˆ๋ž˜ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

์ €๋Š” ๊ฐœ์ธ์ ์œผ๋กœ ์›๋ณธ ๋ฐ์ดํ„ฐ๋ฅผ ํ•„ํ„ฐ๋งํ•˜์—ฌ ํ•™์Šต์‹œํ‚ค๋ฉด ์ด๋Ÿฌํ•œ ๋ฌธ์ œ๋ฅผ ์–ด๋А ์ •๋„ ์™„ํ™”ํ•  ์ˆ˜ ์žˆ๋‹ค๊ณ  ์ƒ๊ฐํ•ฉ๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, ํ•™์Šต ๋ฐ์ดํ„ฐ ์ค‘ ์ผ๋ถ€๋Š” ํ•ญ์ƒ ์‚ฌ๋žŒ์— ์˜ํ•ด ์ƒ์„ฑ๋œ ๋ฐ์ดํ„ฐ๋ฅผ ํฌํ•จ์‹œํ‚ค๊ณ , AI๊ฐ€ ์ƒ์„ฑํ•œ ๋ฐ์ดํ„ฐ๋ฅผ ์ ์ ˆํžˆ ๊ด€๋ฆฌํ•œ๋‹ค๋ฉด, ๋ชจ๋ธ ๋ถ•๊ดด๋ฅผ ํ”ผํ•  ์ˆ˜ ์žˆ์„ ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์‹ค์ œ๋กœ ์—ฐ๊ตฌ์—์„œ๋„ ์ผ๋ถ€ ์›๋ณธ ๋ฐ์ดํ„ฐ๋ฅผ ์œ ์ง€ํ•˜๋ฉด ๋ชจ๋ธ ๋ถ•๊ดด๊ฐ€ ์™„ํ™”๋œ๋‹ค๊ณ  ์–ธ๊ธ‰ํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

๊ทธ๋ ‡๋‹ค๋ฉด ์—ฌ๋Ÿฌ๋ถ„์˜ ์ƒ๊ฐ์€ ์–ด๋– ์‹ ๊ฐ€์š”? AI ์ƒ์„ฑ ์ฝ˜ํ…์ธ ๊ฐ€ AI ๋ชจ๋ธ์— ๋ฏธ์น˜๋Š” ์˜ํ–ฅ์— ๋Œ€ํ•ด ์–ด๋–ป๊ฒŒ ์ƒ๊ฐํ•˜์‹œ๋‚˜์š”? ๋Œ“๊ธ€๋กœ ์—ฌ๋Ÿฌ๋ถ„์˜ ์˜๊ฒฌ์„ ๊ณต์œ ํ•ด ์ฃผ์„ธ์š”! AI์™€ ํ•จ๊ป˜ํ•˜๋Š” ๋ฏธ๋ž˜๋ฅผ ์–ด๋–ป๊ฒŒ ๋งŒ๋“ค์–ด ๋‚˜๊ฐ€์•ผ ํ• ์ง€, ์—ฌ๋Ÿฌ๋ถ„์˜ ์†Œ์ค‘ํ•œ ์˜๊ฒฌ์„ ๊ธฐ๋‹ค๋ฆฝ๋‹ˆ๋‹ค.



-->