[Paper Review] EXAONE 3.5: Series of Large Language Models for Real-world Use Cases

Posted by Euisuk's Dev Log on August 30, 2025

[Paper Review] EXAONE 3.5: Series of Large Language Models for Real-world Use Cases

์›๋ณธ ๊ฒŒ์‹œ๊ธ€: https://velog.io/@euisuk-chung/Paper-Review-EXAONE-3.5-Series-of-Large-Language-Models-for-Real-world-Use-Cases

https://arxiv.org/pdf/2412.04862

1
AN, Soyoung, et al. EXAONE 3.5: Series of Large Language Models for Real-world Use Cases. arXiv e-prints, 2024, arXiv: 2412.04862.

Abstract

์ด ๊ธฐ์ˆ  ๋ณด๊ณ ์„œ๋Š” LG AI Research์—์„œ ๊ฐœ๋ฐœํ•˜๊ณ  ๊ณต๊ฐœํ•œ EXAONE 3.5 instruction-tuned ์–ธ์–ด ๋ชจ๋ธ๋“ค์„ ์†Œ๊ฐœํ•ฉ๋‹ˆ๋‹ค. EXAONE 3.5 ์–ธ์–ด ๋ชจ๋ธ์€ 32B, 7.8B, 2.4B์˜ ์„ธ ๊ฐ€์ง€ ๊ตฌ์„ฑ์œผ๋กœ ์ œ๊ณต๋ฉ๋‹ˆ๋‹ค. ์ด ๋ชจ๋ธ๋“ค์€ ๋‹ค์Œ๊ณผ ๊ฐ™์€ ๋›ฐ์–ด๋‚œ ๋Šฅ๋ ฅ์„ ํŠน์ง•์œผ๋กœ ํ•ฉ๋‹ˆ๋‹ค: 1) ์‹ค์ œ ์‹œ๋‚˜๋ฆฌ์˜ค์—์„œ ํƒ์›”ํ•œ instruction following ๋Šฅ๋ ฅ์œผ๋กœ 7๊ฐœ benchmark์—์„œ ์ตœ๊ณ  ์ ์ˆ˜ ๋‹ฌ์„ฑ, 2) ๋›ฐ์–ด๋‚œ long-context ์ดํ•ด๋ ฅ์œผ๋กœ 4๊ฐœ benchmark์—์„œ ์ตœ๊ณ  ์„ฑ๋Šฅ ๋‹ฌ์„ฑ, 3) 9๊ฐœ ์ผ๋ฐ˜ benchmark์—์„œ ์œ ์‚ฌํ•œ ํฌ๊ธฐ์˜ ์ตœ์‹  ์˜คํ”ˆ ๋ชจ๋ธ๋“ค๊ณผ ๋น„๊ตํ•˜์—ฌ ๊ฒฝ์Ÿ๋ ฅ ์žˆ๋Š” ๊ฒฐ๊ณผ ๋‹ฌ์„ฑ. EXAONE 3.5 ์–ธ์–ด ๋ชจ๋ธ์€ ์—ฐ๊ตฌ ๋ชฉ์ ์œผ๋กœ ๋ˆ„๊ตฌ๋‚˜ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ์œผ๋ฉฐ https://huggingface.co/LGAI-EXAONE ์—์„œ ๋‹ค์šด๋กœ๋“œํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ƒ์—…์  ์ด์šฉ์„ ์œ„ํ•ด์„œ๋Š” LG AI Research์˜ ๊ณต์‹ ์—ฐ๋ฝ์ฒ˜๋กœ ๋ฌธ์˜ํ•˜์‹œ๊ธฐ ๋ฐ”๋ž๋‹ˆ๋‹ค: contact_us@lgresearch.ai.

  1. ์„œ๋ก 

78์–ต ๋งค๊ฐœ๋ณ€์ˆ˜๋ฅผ ๊ฐ€์ง„ EXAONE 3.0 instruction-tuned ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ์€ ํ•œ๊ตญ์–ด์™€ ์˜์–ด์—์„œ ๊ฐ•๋ ฅํ•œ ์ด์ค‘์–ธ์–ด ๋Šฅ๋ ฅ๊ณผ ํƒ์›”ํ•œ ์‹ค์ œ ์„ฑ๋Šฅ ๋ฐ instruction-following ์ˆ™๋ จ๋„๋ฅผ ๋ณด์—ฌ์ฃผ์—ˆ์Šต๋‹ˆ๋‹ค. ์ถœ์‹œ ์ดํ›„, ํ•™์ˆ ๊ณ„์™€ ์‚ฐ์—…๊ณ„์—์„œ ๋‹ค์–‘ํ•œ ํ”ผ๋“œ๋ฐฑ์„ ๋ฐ›์•˜์Šต๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, ํ•™์ˆ  ์—ฐ๊ตฌ์ž๋“ค์€ ๊ณ ์„ฑ๋Šฅ ์ปดํ“จํŒ… ์ธํ”„๋ผ์— ๋Œ€ํ•œ ์ œํ•œ์ ์ธ ์ ‘๊ทผ์œผ๋กœ ์ธํ•ด ์ €์‚ฌ์–‘ GPU์—์„œ ํ›ˆ๋ จํ•˜๊ณ  ๋ฐฐํฌํ•  ์ˆ˜ ์žˆ๋Š” ๋” ์ž‘์€ ๋ชจ๋ธ์˜ ํ•„์š”์„ฑ์„ ๊ฐ•์กฐํ–ˆ์Šต๋‹ˆ๋‹ค. ์‚ฐ์—…๊ณ„์—์„œ๋Š” ๋น„์šฉ ํšจ์œจ์„ฑ์„ ์œ ์ง€ํ•˜๋ฉด์„œ๋„ ํ–ฅ์ƒ๋œ ์„ฑ๋Šฅ์„ ์ œ๊ณตํ•˜๋Š” ๋” ํฐ ๋ชจ๋ธ๊ณผ ๊ธฐ๊ธฐ ๋‚ด ๋ฐฐํฌ์— ์ ํ•ฉํ•œ ๋” ์ž‘์€ ๋ชจ๋ธ์— ๋Œ€ํ•œ ๊ฐ•ํ•œ ์ˆ˜์š”๋ฅผ ํ‘œํ˜„ํ–ˆ์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ, ์ฐธ์กฐ ๋ฌธ์„œ๋‚˜ ์›น ๊ฒ€์ƒ‰ ๊ฒฐ๊ณผ๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ๋‹ต๋ณ€์„ ์ƒ์„ฑํ•˜๋Š” retrieval-augmented generation (RAG) ๊ธฐ์ˆ ์˜ ์ฑ„ํƒ์ด ์ฆ๊ฐ€ํ•˜๋ฉด์„œ, ๋” ๊ธด context๋ฅผ ํšจ๊ณผ์ ์œผ๋กœ ์ฒ˜๋ฆฌํ•  ์ˆ˜ ์žˆ๋Š” ๋ชจ๋ธ์— ๋Œ€ํ•œ ์ƒ๋‹นํ•œ ์ˆ˜์š”๊ฐ€ ์žˆ์—ˆ์Šต๋‹ˆ๋‹ค.

์ด ๋ณด๊ณ ์„œ์—์„œ๋Š” ์‚ฌ์šฉ์ž์˜ ๋‹ค์–‘ํ•œ ์š”๊ตฌ๋ฅผ ์ถฉ์กฑํ•˜๊ธฐ ์œ„ํ•ด ๊ฐœ๋ฐœ๋œ 24์–ต์—์„œ 320์–ต ๋งค๊ฐœ๋ณ€์ˆ˜์— ์ด๋ฅด๋Š” instruction-tuned ์–ธ์–ด ๋ชจ๋ธ ์ปฌ๋ ‰์…˜์ธ EXAONE 3.5 ์–ธ์–ด ๋ชจ๋ธ๋“ค์„ ์†Œ๊ฐœํ•ฉ๋‹ˆ๋‹ค. EXAONE 3.5 ์–ธ์–ด ๋ชจ๋ธ๋“ค์€ ๋‹ค์Œ์„ ํฌํ•จํ•ฉ๋‹ˆ๋‹ค: 1) ์†Œํ˜• ๋˜๋Š” ์ž์›์ด ์ œํ•œ๋œ ๊ธฐ๊ธฐ์—์„œ์˜ ๋ฐฐํฌ์— ์ตœ์ ํ™”๋œ 24์–ต ๋ชจ๋ธ, 2) ์ด์ „ ๋ฒ„์ „๊ณผ ํฌ๊ธฐ๋Š” ๋™์ผํ•˜์ง€๋งŒ ํ–ฅ์ƒ๋œ ์„ฑ๋Šฅ์„ ์ œ๊ณตํ•˜๋Š” 78์–ต ๋ชจ๋ธ, 3) ํƒ์›”ํ•œ ์„ฑ๋Šฅ์„ ์ œ๊ณตํ•˜๋Š” 320์–ต ๋ชจ๋ธ. ๋ชจ๋“  ๋ชจ๋ธ์€ ์ตœ๋Œ€ 32K ํ† ํฐ์˜ long-context ์ฒ˜๋ฆฌ๋ฅผ ์ง€์›ํ•ฉ๋‹ˆ๋‹ค. ๊ฐ ๋ชจ๋ธ์€ ์‹ค์ œ ์‚ฌ์šฉ ์‚ฌ๋ก€์™€ long-context ์ฒ˜๋ฆฌ์—์„œ ์ตœ์‹  ์„ฑ๋Šฅ์„ ๋ณด์—ฌ์ฃผ๋ฉฐ, ์œ ์‚ฌํ•œ ํฌ๊ธฐ์˜ ์ตœ๊ทผ ์ถœ์‹œ๋œ ๋ชจ๋ธ๋“ค๊ณผ ๋น„๊ตํ•˜์—ฌ ์ผ๋ฐ˜ ๋„๋ฉ”์ธ์—์„œ ๊ฒฝ์Ÿ๋ ฅ์„ ์œ ์ง€ํ•ฉ๋‹ˆ๋‹ค.

EXAONE 3.5 ์–ธ์–ด ๋ชจ๋ธ๋“ค์˜ ์ถœ์‹œ๋ฅผ ํ†ตํ•ด ์—ฐ๊ตฌ์ž๋“ค์ด ์ƒ์„ฑํ˜• AI์˜ ๊ฒฝ๊ณ„๋ฅผ ๋„“ํžˆ๊ณ  ์ธ๊ฐ„์˜ ์‚ถ์„ ํ–ฅ์ƒ์‹œํ‚ค๋Š” ํ˜์‹ ์ ์ธ ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜ ๊ฐœ๋ฐœ์— ์˜๊ฐ์„ ๋ฐ›๊ธฐ๋ฅผ ํฌ๋งํ•ฉ๋‹ˆ๋‹ค. ์ด๋Š” LG AI Research์˜ ์‚ฌ๋ช…์ธ โ€œ๋” ๋‚˜์€ ์‚ถ์„ ์œ„ํ•œ AI ๋ฐœ์ „โ€๊ณผ ์ผ์น˜ํ•ฉ๋‹ˆ๋‹ค.

  1. ๋ชจ๋ธ ํ›ˆ๋ จ

์ด ์„น์…˜์—์„œ๋Š” ๋ชจ๋ธ ๊ตฌ์„ฑ์— ๋Œ€ํ•œ ์ƒ์„ธํ•œ ์ •๋ณด์™€ pre-training ๋ฐ post-training ๋‹จ๊ณ„์—์„œ ์‚ฌ์šฉ๋œ ๋ฐฉ๋ฒ•๋“ค, ๊ทธ๋ฆฌ๊ณ  ๊ฐ ํ›ˆ๋ จ ๋‹จ๊ณ„๋ณ„ ๋ฐ์ดํ„ฐ์…‹ ๊ตฌ์„ฑ ๊ณผ์ •์„ ์„ค๋ช…ํ•ฉ๋‹ˆ๋‹ค.

2.1 ๋ชจ๋ธ ๊ตฌ์„ฑ

EXAONE 3.5 ์–ธ์–ด ๋ชจ๋ธ๋“ค์€ ์ตœ์‹  decoder-only Transformer ์•„ํ‚คํ…์ฒ˜๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•˜๋ฉฐ, ์ž์„ธํ•œ ๊ตฌ์„ฑ์€ Table 1์— ์„ค๋ช…๋˜์–ด ์žˆ์Šต๋‹ˆ๋‹ค. ์ด ๋ชจ๋ธ๋“ค์€ ๊ตฌ์กฐ์ ์œผ๋กœ EXAONE 3.0 78์–ต ๋ชจ๋ธ๊ณผ ๋™์ผํ•˜์ง€๋งŒ ์ฃผ๋กœ ํฌ๊ธฐ ๊ด€๋ จ ๊ตฌ์„ฑ์—์„œ ์ฐจ์ด๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค. ์ฃผ๋ชฉํ•  ์ ์€ EXAONE 3.5 ์–ธ์–ด ๋ชจ๋ธ๋“ค์ด long-context fine-tuning์„ ์ฑ„ํƒํ•˜์—ฌ ์ตœ๋Œ€ context ๊ธธ์ด๋ฅผ EXAONE 3.0์˜ 4,096 ํ† ํฐ์—์„œ 32,768 ํ† ํฐ์œผ๋กœ ํ™•์žฅํ–ˆ๋‹ค๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์„ธ ๋ชจ๋ธ ๋ชจ๋‘ ๋Œ€๋žต 50% ํ•œ๊ตญ์–ด์™€ 50% ์˜์–ด๋กœ ๊ตฌ์„ฑ๋œ ๋™์ผํ•œ ์–ดํœ˜๋ฅผ ๊ณต์œ ํ•ฉ๋‹ˆ๋‹ค.

Table 1: EXAONE 3.5 ์–ธ์–ด ๋ชจ๋ธ๋“ค์˜ ๊ตฌ์„ฑ

๋ชจ๋ธ ํฌ๊ธฐ 32B 7.8B 2.4B
d_model 5,120 4,096 2,560
๋ ˆ์ด์–ด ์ˆ˜ 64 32 30
Pre-normalization True True True
Non-linearity SwiGLU SwiGLU SwiGLU
Feedforward dimension 27,392 14,336 7,168
Head type GQA GQA GQA
Head ์ˆ˜ 40 32 32
KV head ์ˆ˜ 8 8 8
Head ํฌ๊ธฐ 128 128 80
์ตœ๋Œ€ ์‹œํ€€์Šค ๊ธธ์ด 32,768 32,768 32,768
RoPE theta 1,000,000 1,000,000 1,000,000
Tokenizer BBPE BBPE BBPE
์–ดํœ˜ ํฌ๊ธฐ 102,400 102,400 102,400
Tied word embedding False False True

2.2 Pre-training

Pre-training ์ฝ”ํผ์Šค ๋ฐ์ดํ„ฐ์˜ ์–‘๊ณผ ๊ณ„์‚ฐ ์ž์›์€ Table 2์— ํ‘œ์‹œ๋˜์–ด ์žˆ์Šต๋‹ˆ๋‹ค. ๋ฐ์ดํ„ฐ ๊ตฌ์„ฑ๊ณผ ๋ชจ๋ธ ํ›ˆ๋ จ ์ ‘๊ทผ๋ฒ•์€ ๋‘ ๋‹จ๊ณ„๋กœ ๊ตฌ์„ฑ๋ฉ๋‹ˆ๋‹ค: 1) ์ผ๋ฐ˜ ๋„๋ฉ”์ธ์—์„œ์˜ ์„ฑ๋Šฅ ํ–ฅ์ƒ์„ ๋ชฉํ‘œ๋กœ ๊ฐ€๋Šฅํ•œ ํ•œ ๋‹ค์–‘ํ•œ ์†Œ์Šค์—์„œ ์ˆ˜์ง‘ํ•˜๊ณ  ์ฒ˜๋ฆฌ๋œ ๋Œ€๊ทœ๋ชจ ํ›ˆ๋ จ ์ฝ”ํผ์Šค๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ 1๋‹จ๊ณ„ pre-training์„ ์ˆ˜ํ–‰ํ•ฉ๋‹ˆ๋‹ค. ๊ทธ ํ›„, 2) ํ‰๊ฐ€๋ฅผ ํ†ตํ•ด ๊ฐ•ํ™”๊ฐ€ ํ•„์š”ํ•œ ๋„๋ฉ”์ธ์— ๋Œ€ํ•ด ๋” ๋งŽ์€ ๋ฐ์ดํ„ฐ๋ฅผ ์ˆ˜์ง‘ํ•˜์—ฌ 2๋‹จ๊ณ„ pre-training์„ ์ˆ˜ํ–‰ํ•ฉ๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, 2๋‹จ๊ณ„์—์„œ๋Š” long-context ์ดํ•ด ๋Šฅ๋ ฅ ํ–ฅ์ƒ์— ์ค‘์ ์„ ๋‘ก๋‹ˆ๋‹ค.

Table 2: EXAONE 3.5 ์–ธ์–ด ๋ชจ๋ธ ๊ตฌ์ถ•์„ ์œ„ํ•œ ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ ์ฝ”ํผ์Šค ํฌ๊ธฐ ๋ฐ ๊ณ„์‚ฐ๋Ÿ‰

๋ชจ๋ธ ํฌ๊ธฐ 32B 7.8B 2.4B
ํ›ˆ๋ จ ํ† ํฐ 6.5T 9T 6.5T
๊ณ„์‚ฐ๋Ÿ‰ (FLOPs) 1.25 ร— 10ยฒโด 4.21 ร— 10ยฒยณ 9.36 ร— 10ยฒยฒ

2.2.1 Context ๊ธธ์ด ํ™•์žฅ

Context ๊ธธ์ด๋ฅผ ํ™•์žฅํ•˜๊ธฐ ์œ„ํ•ด long-context fine-tuning ๊ธฐ์ˆ ์„ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค. ๋ชจ๋ธ์ด 1๋‹จ๊ณ„ pre-training์—์„œ ํ•™์Šตํ•œ ๋‚ด์šฉ์„ ์žŠ์–ด๋ฒ„๋ฆฌ๋Š” catastrophic forgetting ๋ฌธ์ œ๋ฅผ ์™„ํ™”ํ•˜๊ธฐ ์œ„ํ•ด replay-based ๋ฐฉ๋ฒ•์„ ์ ์šฉํ•ฉ๋‹ˆ๋‹ค. ๊ตฌ์ฒด์ ์œผ๋กœ, 2๋‹จ๊ณ„ pre-training ์ค‘์—๋Š” 1๋‹จ๊ณ„์—์„œ ์‚ฌ์šฉ๋œ ๋ฐ์ดํ„ฐ์˜ ์ผ๋ถ€๋ฅผ ์žฌ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค. ์ตœ๋Œ€ context ๊ธธ์ด๋ฅผ ์ดˆ๊ณผํ•˜๋Š” ๋ฌธ์„œ๋“ค์ด 1๋‹จ๊ณ„์—์„œ๋Š” ๋” ์ž‘์€ ์ฒญํฌ๋กœ ๋ถ„ํ• ๋˜์—ˆ์ง€๋งŒ, 2๋‹จ๊ณ„์—์„œ๋Š” ๋ชจ๋ธ์˜ context ๊ธธ์ด๋ฅผ ํ™•์žฅํ•˜๊ธฐ ์œ„ํ•ด ์›๋ณธ ์ฝ”ํผ์Šค๋ฅผ ์ฒญํฌ๋กœ ๋‚˜๋ˆ„์ง€ ์•Š๊ณ  ํ›ˆ๋ จํ•ฉ๋‹ˆ๋‹ค.

2.2.2 Decontamination

๋Œ€๊ทœ๋ชจ ์›น ํฌ๋กค๋ง ์ฝ”ํผ์Šค์˜ ํŠน์„ฑ์ƒ, test-set ์˜ˆ์ œ๋“ค์ด ์ข…์ข… ํ›ˆ๋ จ ์ฝ”ํผ์Šค์— ๋‚˜ํƒ€๋‚ฉ๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ์˜ค์—ผ๋œ ์˜ˆ์ œ๋“ค์€ ์ผ๋ฐ˜ํ™” ์„ฑ๋Šฅ์„ ํ•ด์น˜๊ณ  ํ…Œ์ŠคํŠธ ๋ฉ”ํŠธ๋ฆญ์„ ํ˜ผ๋ž€์Šค๋Ÿฝ๊ฒŒ ํ•˜์—ฌ ์‚ฌ์šฉ์ž์—๊ฒŒ ๋ถˆ๊ณต์ •ํ•œ ํ‰๊ฐ€๋ฅผ ์ œ์‹œํ•  ๊ฐ€๋Šฅ์„ฑ์ด ์žˆ์Šต๋‹ˆ๋‹ค. ์˜ค์—ผ๋œ ์˜ˆ์ œ๋“ค์ด EXAONE 3.5 ์–ธ์–ด ๋ชจ๋ธ๋“ค์˜ ์ผ๋ฐ˜ํ™” ์„ฑ๋Šฅ์„ ์ €ํ•ดํ•˜๋Š” ๊ฒƒ์„ ๋ฐฉ์ง€ํ•˜๊ธฐ ์œ„ํ•ด, ๋ชจ๋“  ๋Œ€์ƒ benchmark ํ…Œ์ŠคํŠธ ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•ด ์—„๊ฒฉํ•œ decontamination ๊ณผ์ •์„ ์ ์šฉํ•˜๊ณ  ํ›ˆ๋ จ ํŒŒ์ดํ”„๋ผ์ธ์—์„œ ์˜ค์—ผ๋œ ์˜ˆ์ œ๋“ค์„ ์ œ๊ฑฐํ–ˆ์Šต๋‹ˆ๋‹ค.

๋” ์—„๊ฒฉํ•œ ๊ธฐ์ค€์„ ์ ์šฉํ•œ ๊ฐ„๋‹จํ•˜์ง€๋งŒ ๊ฐ•๋ ฅํ•œ substring-level matching ๋ฐฉ๋ฒ•์„ ์‚ฌ์šฉํ–ˆ์Šต๋‹ˆ๋‹ค. ์ „์ฒด decontamination ๊ณผ์ •์€ Appendix C์˜ Figure 4์— ์„ค๋ช…๋˜์–ด ์žˆ์Šต๋‹ˆ๋‹ค. ๋จผ์ € ์•ŒํŒŒ๋ฒณ๊ณผ ์ˆซ์ž๋ฅผ ์ œ์™ธํ•œ ๋ชจ๋“  ๋‹ค๋ฅธ ๋ฌธ์ž๋ฅผ ์ œ๊ฑฐํ•˜์—ฌ ๋ชจ๋“  test-set ์˜ˆ์ œ๋“ค์„ ์ •๊ทœํ™”ํ•œ ๋‹ค์Œ, sliding window ํฌ๊ธฐ S = 50๊ณผ stride 1์„ ์‚ฌ์šฉํ•˜์—ฌ ๋ชจ๋“  ๊ณ ์œ ํ•œ substring์„ ์ถ”์ถœํ•ฉ๋‹ˆ๋‹ค. ํ›ˆ๋ จ ์˜ˆ์ œ๊ฐ€ ์˜ค์—ผ๋˜์—ˆ๋Š”์ง€ ํŒ๋‹จํ•˜๊ธฐ ์œ„ํ•ด, ์ •๊ทœํ™”๋œ ํ›ˆ๋ จ ์˜ˆ์ œ์—์„œ N = 10๊ฐœ์˜ substring์„ ๋ฌด์ž‘์œ„๋กœ ์ƒ˜ํ”Œ๋งํ•˜์—ฌ substring pool์— ์กด์žฌํ•˜๋Š”์ง€ ํ™•์ธํ•ฉ๋‹ˆ๋‹ค.

2.2.3 ํ›ˆ๋ จ ๋น„์šฉ

๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ(LLM)์˜ pre-training ๊ณ„์‚ฐ ๋น„์šฉ์„ ๊ณ ๋ คํ•  ๋•Œ, ์ œํ•œ๋œ ์ž์›์œผ๋กœ ๊ฐ€๋Šฅํ•œ ํ•œ ๋†’์€ ์„ฑ๋Šฅ์„ ๋‹ฌ์„ฑํ•˜์—ฌ ํ›ˆ๋ จ์„ ํšจ์œจ์ ์œผ๋กœ ๋งŒ๋“œ๋Š” ๊ฒƒ์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค. Table 3์€ EXAONE 3.5 32B ์–ธ์–ด ๋ชจ๋ธ๊ณผ ์œ ์‚ฌํ•œ ํฌ๊ธฐ์˜ ๋‹ค๋ฅธ ๋ชจ๋ธ๋“ค ๊ฐ„์˜ pre-training์— ํ•„์š”ํ•œ ์ด ๊ณ„์‚ฐ๋Ÿ‰์„ ๋น„๊ตํ•ฉ๋‹ˆ๋‹ค. ์ด ๊ณ„์‚ฐ๋Ÿ‰์„ ๋ชจ๋ธ ํฌ๊ธฐ์™€ ํ›ˆ๋ จ ํ† ํฐ ์ˆ˜์˜ ๊ณฑ์œผ๋กœ ๋‹จ์ˆœ ๊ทผ์‚ฌํ•  ๋•Œ, ์˜ˆ๋ฅผ ๋“ค์–ด Qwen 2.5 32B๋Š” EXAONE 3.5 32B๋ณด๋‹ค 2.77๋ฐฐ ๋งŽ์€ ๊ณ„์‚ฐ์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค. EXAONE 3.5 ์–ธ์–ด ๋ชจ๋ธ๋“ค์˜ ์ฃผ๋ชฉํ•  ๋งŒํ•œ ํŠน์ง• ์ค‘ ํ•˜๋‚˜๋Š” ๋‹ค๋ฅธ ๋ฒ ์ด์Šค๋ผ์ธ ๋ชจ๋ธ๋“ค๋ณด๋‹ค ๋‚ฎ์€ ๋น„์šฉ์œผ๋กœ ํ›ˆ๋ จ๋˜์—ˆ์Œ์—๋„ ๋ถˆ๊ตฌํ•˜๊ณ  ๋†’์€ ์„ฑ๋Šฅ์„ ๋ณด์—ฌ์ค€๋‹ค๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค(Section 3 ์ฐธ์กฐ).

Table 3: ๋ชจ๋ธ ๊ตฌ์ถ•์„ ์œ„ํ•œ ์ด ๊ณ„์‚ฐ๋Ÿ‰ ๋น„๊ต

๋ชจ๋ธ ๋ชจ๋ธ ํฌ๊ธฐ ํ›ˆ๋ จ ํ† ํฐ ๊ณ„์‚ฐ๋Ÿ‰ (๋น„์œจ)
EXAONE 3.5 32B 6.5T 1.00
Qwen 2.5 32B 18T 2.77
Gemma 2 27B 13T 1.69
Yi 1.5 34B 3.6T 0.59

2.3 Post-training

Pre-training ์ดํ›„, ๋ชจ๋ธ๋“ค์€ instruction-following ๋Šฅ๋ ฅ์„ ๊ฐ•ํ™”ํ•˜๊ณ  ์ธ๊ฐ„์˜ ์„ ํ˜ธ๋„์™€ ์ผ์น˜์‹œํ‚ค๊ธฐ ์œ„ํ•œ ์ถ”๊ฐ€ ๊ณผ์ •์„ ๊ฑฐ์น˜๋ฉฐ, ์ด๋Š” supervised fine-tuning (SFT)๊ณผ preference optimization์œผ๋กœ ์ž˜ ์•Œ๋ ค์ ธ ์žˆ์Šต๋‹ˆ๋‹ค.

2.3.1 Supervised Fine-tuning

์ƒˆ๋กญ๊ฑฐ๋‚˜ ๋ณด์ง€ ๋ชปํ•œ instruction์—์„œ ์ž˜ ์ˆ˜ํ–‰ํ•˜๊ธฐ ์œ„ํ•ด, ๋ชจ๋ธ์€ ๋‹ค์–‘ํ•œ ๋„๋ฉ”์ธ์—์„œ ๋‹ค์–‘ํ•œ ๋‚œ์ด๋„์˜ instruction-response ๋ฐ์ดํ„ฐ์…‹ ์Œ์œผ๋กœ ํ›ˆ๋ จ๋˜์–ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. ๋”ฐ๋ผ์„œ ๊ด‘๋ฒ”์œ„ํ•œ ๋ถ„์•ผ๋ฅผ ๋‹ค๋ฃจ๋Š” ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ๋ฅผ ๊ตฌ์ถ•ํ•˜๊ธฐ ์œ„ํ•ด, Figure 1์— ํ‘œ์‹œ๋œ ๋ฐ”์™€ ๊ฐ™์ด ๋ถ„๋ฅ˜ ์ฒด๊ณ„๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ 800๋งŒ ์›น ์ฝ”ํผ์Šค์—์„œ ํ•ต์‹ฌ ์ง€์‹์„ ์ถ”์ถœํ–ˆ์Šต๋‹ˆ๋‹ค. ๊ทธ ๋‹ค์Œ ์ถ”์ถœ๋œ ์ง€์‹ ๋ถ„๋ฅ˜๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ instruction-tuning ๋ฐ์ดํ„ฐ์…‹์„ ์ƒ์„ฑํ–ˆ์Šต๋‹ˆ๋‹ค. ๋งˆ์ง€๋ง‰์œผ๋กœ, instruction evolution ๋ฐฉ๋ฒ•์„ ํ™œ์šฉํ•˜์—ฌ ๋‹ค์–‘ํ•œ ๋ณต์žก์„ฑ๊ณผ ๋‚œ์ด๋„๋ฅผ ๊ฐ€์ง„ instruction๋“ค์ด ์ƒ์„ฑ๋  ์ˆ˜ ์žˆ๋„๋ก ๋ณต์žก์„ฑ ์ˆ˜์ค€์„ ๋‹ค์–‘ํ™”ํ–ˆ์Šต๋‹ˆ๋‹ค.

2.3.2 Preference Optimization

DPO์™€ SimPO์™€ ๊ฐ™์€ Direct alignment algorithms (DAAs)๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ supervised fine-tuning ํ›„ ๋ชจ๋ธ์„ ํ›ˆ๋ จ์‹œ์ผœ ์ธ๊ฐ„์˜ ์„ ํ˜ธ๋„์™€ ์ผ์น˜์‹œํ‚ต๋‹ˆ๋‹ค. ํ•ฉ์„ฑ ๋ฐ์ดํ„ฐ์™€ ์‚ฌ์ „ ์ˆ˜์ง‘๋œ ๋ฐ์ดํ„ฐ๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ํ›ˆ๋ จ์„ ์œ„ํ•œ preference ๋ฐ์ดํ„ฐ๋ฅผ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. ์‘๋‹ต ์ƒ์„ฑ์„ ์œ„ํ•ด, preference ๋ฐ์ดํ„ฐ์—์„œ ๊ฐ€์ ธ์˜จ ํ”„๋กฌํ”„ํŠธ x์— ๋Œ€ํ•ด ์—ฌ๋Ÿฌ ๋ชจ๋ธ์—์„œ N๊ฐœ์˜ ์‘๋‹ต์„ ์ƒ˜ํ”Œ๋งํ•˜๊ณ  reward ๋ชจ๋ธ์˜ ์ ์ˆ˜๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ์ตœ๊ณ  ์‘๋‹ต์„ yw๋กœ, ์ตœ์•… ์‘๋‹ต์„ yl๋กœ ์„ ํƒํ•˜์—ฌ preference ๋ฐ์ดํ„ฐ {x, yw, yl}๋ฅผ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. Preference ๋ฐ์ดํ„ฐ๋ฅผ ๊ฒ€์ฆํ•˜๊ธฐ ์œ„ํ•ด, ์ถ”๊ฐ€ reward ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•˜์—ฌ ๋‘ reward ๋ชจ๋ธ์˜ ์ˆœ์œ„๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ์ผ์น˜๋„๋ฅผ ๊ณ„์‚ฐํ•˜๊ณ  ์ž„๊ณ„๊ฐ’ ์ดํ•˜์˜ ์ผ์น˜๋„๋ฅผ ๊ฐ€์ง„ ๋ฐ์ดํ„ฐ๋ฅผ ํ•„ํ„ฐ๋งํ•ฉ๋‹ˆ๋‹ค. ์šฐ๋ฆฌ์˜ preference optimization์€ M0๊ฐ€ SFT ๋ชจ๋ธ์—์„œ ์ดˆ๊ธฐํ™”๋˜๋Š” ์—ฌ๋Ÿฌ ๋‹จ๊ณ„๋กœ ๊ตฌ์„ฑ๋˜์–ด DAAs๋ฅผ ํ†ตํ•ด ๋ชจ๋ธ M1๊ณผ M2๋ฅผ ์ˆœ์ฐจ์ ์œผ๋กœ ํ›ˆ๋ จํ•ฉ๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๋‹จ๊ณ„๋ณ„ ํŒŒ์ดํ”„๋ผ์ธ์„ ํ†ตํ•ด DAAs ํ›ˆ๋ จ ๊ณผ์ • ์ค‘ ๋ฐœ์ƒํ•  ์ˆ˜ ์žˆ๋Š” over-optimization์„ ์™„ํ™”ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

2.4 ๋ฐ์ดํ„ฐ ์ปดํ”Œ๋ผ์ด์–ธ์Šค

AI ๋ชจ๋ธ ๊ฐœ๋ฐœ์—๋Š” ๋Œ€๋Ÿ‰์˜ ๋ฐ์ดํ„ฐ๊ฐ€ ํ•„์š”ํ•˜๋ฉฐ, ์ด ๋ฐ์ดํ„ฐ์˜ ํš๋“๊ณผ ํ™œ์šฉ์€ ์ €์ž‘๊ถŒ ์นจํ•ด, ์ง€์  ์žฌ์‚ฐ๊ถŒ ์นจํ•ด, ๊ฐœ์ธ์ •๋ณด ๋ณดํ˜ธ ์œ„๋ฐ˜ ๋“ฑ ๋‹ค์–‘ํ•œ ๋ฒ•์  ๋ฌธ์ œ๋กœ ์ด์–ด์งˆ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ์œ„ํ—˜์„ ์ตœ์†Œํ™”ํ•˜๊ธฐ ์œ„ํ•ด, LG AI Research๋Š” ๋ฐ์ดํ„ฐ ์ˆ˜์ง‘, AI ๋ชจ๋ธ ํ›ˆ๋ จ, ์ •๋ณด ์ œ๊ณต์˜ ์ „์ฒด ๊ณผ์ •์— ๊ฑธ์ณ AI Compliance ๊ฒ€ํ† ๋ฅผ ์ˆ˜ํ–‰ํ•ฉ๋‹ˆ๋‹ค. ๋” ์ž์„ธํ•œ ์ •๋ณด๋Š” EXAONE 3.0 ๊ธฐ์ˆ  ๋ณด๊ณ ์„œ์™€ LG AI ์œค๋ฆฌ ์›์น™์„ ์ฐธ์กฐํ•˜์‹œ๊ธฐ ๋ฐ”๋ž๋‹ˆ๋‹ค.

  1. ํ‰๊ฐ€

์ด ์„น์…˜์—์„œ๋Š” ๋‹ค์–‘ํ•œ benchmark ๋ฐ์ดํ„ฐ์…‹์—์„œ EXAONE 3.5 ์–ธ์–ด ๋ชจ๋ธ๋“ค์˜ ํ‰๊ฐ€ ์„ค์ •๊ณผ ๊ฒฐ๊ณผ๋ฅผ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค. ์šฐ๋ฆฌ ๋ชจ๋ธ๋“ค์˜ benchmark ์„ฑ๋Šฅ์„ ๋น„๊ตํ•˜๊ธฐ ์œ„ํ•ด ์ตœ๊ทผ ์ถœ์‹œ๋œ ์˜คํ”ˆ ์–ธ์–ด ๋ชจ๋ธ๋“ค์„ ๋ฒ ์ด์Šค๋ผ์ธ์œผ๋กœ ์„ ํƒํ–ˆ์Šต๋‹ˆ๋‹ค. ๋ชจ๋“  ๋ฒ ์ด์Šค๋ผ์ธ๊ณผ ๊ทธ๋“ค์˜ ์ƒ์„ธํ•œ ์ •๋ณด๋Š” Appendix D.1์— ์„ค๋ช…๋˜์–ด ์žˆ์Šต๋‹ˆ๋‹ค.

3.1 Benchmarks

์‚ฌ์šฉ์ž ์˜๋„์˜ ๋‹ค์–‘ํ•œ ํŠน์„ฑ์„ ๊ณ ๋ คํ•  ๋•Œ, instruction-tuned ๋ชจ๋ธ์ด ๋ฌด์—‡์ด๋“  ์‚ฌ์šฉ์ž์˜ ์ฟผ๋ฆฌ์— ๋งž์ถฐ ์‘๋‹ต์„ ์ƒ์„ฑํ•˜๋Š” ๊ฒƒ์ด ์ค‘์š”ํ•ฉ๋‹ˆ๋‹ค. ํฌ๊ด„์ ์ด๊ณ  ๋‹ค์–‘ํ•œ ์‹œ๋‚˜๋ฆฌ์˜ค์—์„œ ์šฐ๋ฆฌ ๋ชจ๋ธ๋“ค์„ ํ‰๊ฐ€ํ•˜๊ธฐ ์œ„ํ•ด, ๋ช‡ ๊ฐ€์ง€ ์ž์ฒด benchmark์™€ ํ•จ๊ป˜ 12๊ฐœ ์ด์ƒ์˜ ํ‰๊ฐ€ benchmark๋ฅผ ์„ ํƒํ–ˆ์Šต๋‹ˆ๋‹ค. Table 4๋Š” ์„ธ ๊ฐœ์˜ ์นดํ…Œ๊ณ ๋ฆฌ๋กœ ๊ทธ๋ฃนํ™”ํ•  ์ˆ˜ ์žˆ๋Š” ๋ชจ๋“  benchmark๋ฅผ ์š”์•ฝํ•ฉ๋‹ˆ๋‹ค:

โ€ข ์‹ค์ œ ์‚ฌ์šฉ ์‚ฌ๋ก€ (Section 3.3): ๋‹ค์–‘ํ•œ ์‚ฌ์šฉ์ž instruction์„ ์ดํ•ดํ•˜๊ณ  ์ˆ˜ํ–‰ํ•˜๋Š” ๋Šฅ๋ ฅ์ด ํ•„์š”ํ•œ benchmark๋“ค
โ€ข Long Context (Section 3.4): long context๋ฅผ ์ดํ•ดํ•˜๋Š” ๋Šฅ๋ ฅ์„ ํ‰๊ฐ€ํ•˜๋Š” benchmark๋“ค
โ€ข ์ผ๋ฐ˜ ๋„๋ฉ”์ธ (Section 3.5): LLM๋“ค์ด ๊ฐ€์ ธ์•ผ ํ•  ์ผ๋ฐ˜ ๋„๋ฉ”์ธ ๋Šฅ๋ ฅ์„ ํฌ๊ด„ํ•˜๋Š” benchmark๋“ค. ๊ตฌ์ฒด์ ์œผ๋กœ, ์ด ์นดํ…Œ๊ณ ๋ฆฌ๋Š” ์ˆ˜ํ•™ ๋ฌธ์ œ๋ฅผ ํ‘ธ๋Š” ๋Šฅ๋ ฅ, ์†Œ์Šค ์ฝ”๋“œ๋ฅผ ์ž‘์„ฑํ•˜๋Š” ๋Šฅ๋ ฅ, LLM์— ๋‚ด์žฅ๋œ parametric knowledge๋ฅผ ์ธก์ •ํ•˜๋Š” benchmark๋“ค์„ ํฌํ•จํ•ฉ๋‹ˆ๋‹ค.

3.2 ์ „์ฒด ์„ฑ๋Šฅ

์„ธ ์นดํ…Œ๊ณ ๋ฆฌ์— ๋Œ€ํ•œ ์ „์ฒด ์„ฑ๋Šฅ ๊ฒฐ๊ณผ๊ฐ€ Table 5์— ์ œ์‹œ๋˜์–ด ์žˆ์Šต๋‹ˆ๋‹ค. 32B์™€ 78์–ต ํฌ๊ธฐ์˜ EXAONE 3.5 ์–ธ์–ด ๋ชจ๋ธ๋“ค์€ ๋ฒ ์ด์Šค๋ผ์ธ ๋ชจ๋ธ๋“ค๊ณผ ๋น„๊ตํ•˜์—ฌ ์‹ค์ œ ์‚ฌ์šฉ ์‚ฌ๋ก€์™€ Long Context ์นดํ…Œ๊ณ ๋ฆฌ์—์„œ ์ตœ๊ณ  ์„ฑ๋Šฅ์„ ๋ณด์ด๋ฉฐ, ์ผ๋ฐ˜ ๋„๋ฉ”์ธ ์นดํ…Œ๊ณ ๋ฆฌ์—์„œ๋Š” ๊ฒฝ์Ÿ๋ ฅ ์žˆ๋Š” ๊ฒฐ๊ณผ๋ฅผ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค. ๊ฐ€์žฅ ์ž‘์€ ๋ชจ๋ธ์ธ EXAONE 3.5 24์–ต์€ ์„ธ ์นดํ…Œ๊ณ ๋ฆฌ ๋ชจ๋‘์—์„œ ์œ ์‚ฌํ•œ ํฌ๊ธฐ์˜ ๋ฒ ์ด์Šค๋ผ์ธ๋“ค์„ ๋Šฅ๊ฐ€ํ•˜์—ฌ ๊ฐ•๋ ฅํ•œ ์„ฑ๋Šฅ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค. ๋†€๋ž๊ฒŒ๋„, 24์–ต ๋ชจ๋ธ์€ ์ž‘์€ ํฌ๊ธฐ์—๋„ ๋ถˆ๊ตฌํ•˜๊ณ  ์ผ๋ฐ˜ ๋„๋ฉ”์ธ์—์„œ Qwen 2.5 7B๋ฅผ ์ œ์™ธํ•˜๊ณ ๋Š” ๋” ํฐ ํฌ๊ธฐ(<90์–ต)์˜ ๋ฒ ์ด์Šค๋ผ์ธ๋“ค๊ณผ ๋น„๊ตํ•ด๋„ ๋” ๋‚˜์€ ์„ฑ๋Šฅ์„ ๋ณด์˜€์Šต๋‹ˆ๋‹ค. ์ตœ๊ทผ smaller large language models (sLLM)์— ๋Œ€ํ•œ ์ˆ˜์š” ์ฆ๊ฐ€๋ฅผ ๊ณ ๋ คํ•  ๋•Œ, EXAONE 3.5 24์–ต ๋ชจ๋ธ์ด ํ•™์ˆ ์  ๋ฐ ์‚ฐ์—…์  ์‚ฌ์šฉ์—์„œ ๋†’์€ ๊ฒฝ์Ÿ๋ ฅ์„ ๊ฐ–์ถœ ์ˆ˜ ์žˆ๋‹ค๊ณ  ๋ฏฟ์Šต๋‹ˆ๋‹ค.

3.3 ์‹ค์ œ ์‚ฌ์šฉ ์‚ฌ๋ก€

์‹ค์ œ ์‚ฌ์šฉ ์‚ฌ๋ก€ ์นดํ…Œ๊ณ ๋ฆฌ์˜ ๊ฒฝ์šฐ, ์‚ฌ์šฉ์ž๊ฐ€ ์ฑ—๋ด‡ ๋ชจ๋ธ์— ์ œ์ถœํ•  ์ˆ˜ ์žˆ๋Š” ์‹ค์ œ ์ฟผ๋ฆฌ๋ฅผ ๋‚˜ํƒ€๋‚ด๋Š” 7๊ฐœ์˜ benchmark๋ฅผ ์ปดํŒŒ์ผํ–ˆ์Šต๋‹ˆ๋‹ค. MT-BENCH, KOMT-BENCH, LOGICKOR์—์„œ๋Š” multi-turn์œผ๋กœ ๊ตฌ์„ฑ๋œ ๋ชจ๋ธ์˜ ์‘๋‹ต์ด judge ๋ชจ๋ธ์— ์˜ํ•ด ํ‰๊ฐ€๋ฉ๋‹ˆ๋‹ค. ARENA-HARD์™€ ALPACAEVAL์˜ ๊ฒฝ์šฐ, ๋Œ€์ƒ ์–ธ์–ด ๋ชจ๋ธ์˜ ์‘๋‹ต์ด ์ฐธ์กฐ ๋ชจ๋ธ(๊ฐ๊ฐ gpt-4-0314์™€ gpt-4-1106-preview)์˜ ์‘๋‹ต๊ณผ judge ๋ชจ๋ธ์— ์˜ํ•ด ๋น„๊ต๋˜์–ด ์Šน๋ฅ ์„ ๊ธฐ๋กํ•ฉ๋‹ˆ๋‹ค. LIVEBENCH (ver. 2024-08-31)์™€ IFEVAL (prompt-strict)๋Š” ๋ชจ๋ธ์˜ ์‘๋‹ต์ด ground-truth ์‘๋‹ต๊ณผ ์ผ์น˜์‹œ์ผœ ์‚ฌ์šฉ์ž instruction์— ์–ผ๋งˆ๋‚˜ ์ž˜ ๋ถ€ํ•ฉํ•˜๋Š”์ง€ ํ‰๊ฐ€ํ•ฉ๋‹ˆ๋‹ค.

Table 6์— ์ œ์‹œ๋œ ๋ฐ”์™€ ๊ฐ™์ด, ์šฐ๋ฆฌ์˜ ์„ธ ๋ชจ๋ธ์€ 32B ๋ชจ๋ธ์˜ LIVEBENCH๋ฅผ ์ œ์™ธํ•˜๊ณ ๋Š” ์œ ์‚ฌํ•œ ํฌ๊ธฐ์˜ ๋ชจ๋“  ๋ฒ ์ด์Šค๋ผ์ธ์—์„œ ๋ชจ๋“  benchmark์—์„œ ์ตœ๊ณ  ์„ฑ๋Šฅ์„ ๋ณด์˜€์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ, ์˜์–ด์™€ ํ•œ๊ตญ์–ด benchmark ๋ชจ๋‘์—์„œ ๋‹ค๋ฅธ ๋ชจ๋ธ๋“ค์„ ๋Šฅ๊ฐ€ํ•จ์œผ๋กœ์จ EXAONE 3.5 ์–ธ์–ด ๋ชจ๋ธ๋“ค์˜ ๋›ฐ์–ด๋‚œ ์ด์ค‘์–ธ์–ด ๋Šฅ๋ ฅ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.

3.4 Long Context

Long context๋ฅผ ์ฒ˜๋ฆฌํ•˜๊ณ  ์ดํ•ดํ•˜๋Š” ๋Šฅ๋ ฅ์€ ๋” ๋ณต์žกํ•œ ์‹œ๋‚˜๋ฆฌ์˜ค์—์„œ์˜ ํ™œ์šฉ์„ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•˜๋ฏ€๋กœ ํ˜„๋Œ€ LLM๋“ค์—๊ฒŒ ์ ์  ์ค‘์š”ํ•ด์ง€๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. EXAONE 3.5 ์–ธ์–ด ๋ชจ๋ธ๋“ค์˜ long context ์„ฑ๋Šฅ์„ ๋ณด์—ฌ์ฃผ๊ธฐ ์œ„ํ•ด, long context ์ž…๋ ฅ์„ ์œ„ํ•œ ํ•ฉ์„ฑ ์ž‘์—…์„ ์œ„ํ•ด ์„ค๊ณ„๋œ benchmark์™€ ํ•จ๊ป˜ ๋‹ค์–‘ํ•œ retrieval-augmented generation (RAG) benchmark๋“ค์„ ์‚ฌ์šฉํ•˜์—ฌ ๋ชจ๋ธ๋“ค์„ ํ‰๊ฐ€ํ•ฉ๋‹ˆ๋‹ค.

3.4.1 Needle-in-a-Haystack

Needle-in-a-Haystack (NIAH)๋Š” ๋ชจ๋ธ์ด ๊ธด ๋ฌธ์„œ ๋‚ด์˜ ๋ฌด์ž‘์œ„ ์œ„์น˜์— ์ˆจ๊ฒจ์ง„ ์ •๋ณด๋ฅผ ์–ผ๋งˆ๋‚˜ ํšจ๊ณผ์ ์œผ๋กœ ์ฐพ๊ณ  ๊ฒ€์ƒ‰ํ•  ์ˆ˜ ์žˆ๋Š”์ง€ ํ‰๊ฐ€ํ•˜๋Š” benchmark ์—ญํ• ์„ ํ•ฉ๋‹ˆ๋‹ค. 32K ํ† ํฐ๊นŒ์ง€ long context์—์„œ ์ •๋ณด๋ฅผ ์ฒ˜๋ฆฌํ•˜๊ณ  ๊ฒ€์ƒ‰ํ•˜๋Š” ๋ชจ๋ธ๋“ค์˜ ๋Šฅ๋ ฅ์„ ์ข…ํ•ฉ์ ์œผ๋กœ ํ‰๊ฐ€ํ–ˆ์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ, NIAH๋ฅผ ํ•œ๊ตญ์–ด๋กœ ํ™•์žฅํ•˜์—ฌ ์˜์–ด์™€ ํ•œ๊ตญ์–ด context ๋ชจ๋‘์—์„œ ๋ชจ๋ธ๋“ค์˜ long context ์ฒ˜๋ฆฌ ๋Šฅ๋ ฅ์„ ํ‰๊ฐ€ํ•˜๋Š” ๋ฐ ํ™œ์šฉํ–ˆ์Šต๋‹ˆ๋‹ค.

Figure 3์€ ์šฐ๋ฆฌ ๋ชจ๋ธ๋“ค์ด ์˜์–ด์™€ ํ•œ๊ตญ์–ด ๋ชจ๋‘์—์„œ ํ…Œ์ŠคํŠธ๋œ ๋ชจ๋“  ๋ฌธ์„œ ๊นŠ์ด์™€ context ๊ธธ์ด์—์„œ ๋Œ€์ƒ ์ •๋ณด ๊ฒ€์ƒ‰์— ๊ฑฐ์˜ ์™„๋ฒฝํ•œ ์ •ํ™•๋„๋ฅผ ๋‹ฌ์„ฑํ•œ๋‹ค๋Š” ๊ฒƒ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๊ฒฐ๊ณผ๋Š” ํŠนํžˆ ์ •ํ™•ํ•œ ์ •๋ณด ๊ฒ€์ƒ‰๊ณผ ๋ณต์žกํ•œ ์ถ”๋ก ์„ ์š”๊ตฌํ•˜๋Š” ์ž‘์—…์—์„œ ๊ฐ•๋ ฅํ•œ long context ์ฒ˜๋ฆฌ ๋Šฅ๋ ฅ์„ ๊ฐ•์กฐํ•ฉ๋‹ˆ๋‹ค.

3.4.2 Long Context Understanding

Long context ์ดํ•ด ๋Šฅ๋ ฅ์„ ํ‰๊ฐ€ํ•˜๊ธฐ ์œ„ํ•ด, LONGBENCH์™€ LONGRAG๋ฅผ ํฌํ•จํ•œ benchmark๋“ค์„ ์‚ฌ์šฉํ•˜์—ฌ ๋ชจ๋ธ๋“ค์„ ํ‰๊ฐ€ํ–ˆ์Šต๋‹ˆ๋‹ค. LongRAG์—์„œ unanswerable case๋ฅผ ํ™•์žฅํ•˜์—ฌ ๋” ๋„์ „์ ์œผ๋กœ ๋งŒ๋“ค์—ˆ์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ ํ•œ๊ตญ์–ด์—์„œ์˜ long context ์ดํ•ด๋ฅผ ํ‰๊ฐ€ํ•˜๊ธฐ ์œ„ํ•ด LONGRAG์˜ ํ•œ๊ตญ์–ด ๋ฒ„์ „์ธ KO-LONGRAG๋ฅผ ๊ตฌ์ถ•ํ–ˆ์Šต๋‹ˆ๋‹ค. ์‹ค์ œ ์›น ๊ฒ€์ƒ‰ ๊ฒฐ๊ณผ๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ์–ด๋ ค์šด ์งˆ๋ฌธ์— ๋‹ต๋ณ€ํ•ด์•ผ ํ•˜๋Š” ๋” ํ˜„์‹ค์ ์ธ RAG ์‹œ๋‚˜๋ฆฌ์˜ค๋ฅผ ์œ„ํ•ด KO-WEBRAG benchmark๋ฅผ ๊ตฌ์ถ•ํ–ˆ์Šต๋‹ˆ๋‹ค.

Table 7์— ํ‘œ์‹œ๋œ ๋ฐ”์™€ ๊ฐ™์ด, EXAONE 3.5 ์–ธ์–ด ๋ชจ๋ธ๋“ค์€ 32B์™€ 78์–ต ๋ชจ๋ธ์˜ LongBench๋ฅผ ์ œ์™ธํ•˜๊ณ ๋Š” ๋‹ค๋ฅธ ๋ชจ๋ธ๋“ค๋ณด๋‹ค ๋›ฐ์–ด๋‚œ ์„ฑ๋Šฅ์„ ๋ณด์˜€์Šต๋‹ˆ๋‹ค. benchmark ์ „์ฒด์˜ ํ‰๊ท ์—์„œ ์šฐ๋ฆฌ์˜ ์„ธ ๋ชจ๋ธ์€ ๋ชจ๋“  ๋ฒ ์ด์Šค๋ผ์ธ์„ ๋Šฅ๊ฐ€ํ•˜์—ฌ, ๋ณต์žกํ•˜๊ณ  ํ™•์žฅ๋œ context๋ฅผ ํšจ๊ณผ์ ์œผ๋กœ ์ฒ˜๋ฆฌํ•˜๋Š” ๋Šฅ๋ ฅ์„ ํ™•์ธํ–ˆ์Šต๋‹ˆ๋‹ค.

3.5 ์ผ๋ฐ˜ ๋„๋ฉ”์ธ

์–ธ์–ด ๋ชจ๋ธ๋“ค์€ ์ด์ œ ์ˆ˜ํ•™ ๋ฌธ์ œ ํ•ด๊ฒฐ์ด๋‚˜ ์†Œ์Šค ์ฝ”๋“œ ํ”„๋กœ๊ทธ๋žจ ์ž‘์„ฑ๊ณผ ๊ฐ™์€ ๋‹ค์–‘ํ•œ ์ผ๋ฐ˜ ๋„๋ฉ”์ธ์—์„œ ์ธ๊ฐ„ ์ˆ˜์ค€์˜ ๋Šฅ๋ ฅ์„ ๋‹ฌ์„ฑํ•˜๋Š” ๊ฒƒ์ด ๊ธฐ๋Œ€๋ฉ๋‹ˆ๋‹ค. ์ผ๋ฐ˜ ๋„๋ฉ”์ธ์—์„œ์˜ ์ „์ฒด ์„ฑ๋Šฅ์„ ํ‰๊ฐ€ํ•˜๊ธฐ ์œ„ํ•ด, ์„ธ ๊ฐ€์ง€ ์ฃผ์š” ๋„๋ฉ”์ธ์—์„œ 9๊ฐœ์˜ benchmark๋ฅผ ์„ ํƒํ–ˆ์Šต๋‹ˆ๋‹ค: 1) ์ˆ˜ํ•™์„ ์œ„ํ•œ GSM8K (CoT)์™€ MATH (CoT), 2) ์ฝ”๋”ฉ์„ ์œ„ํ•œ HUMANEVAL (Evalplus base)์™€ MBPP (Evalplus base), 3) LLM์— ๋‚ด์žฅ๋œ ์ง€์‹๋Ÿ‰์„ ํ‰๊ฐ€ํ•˜๊ธฐ ์œ„ํ•œ MMLU (CoT), KMMLU (CoT), GPQA (CoT), ARC-C, BBH (CoT).

์ฑ—๋ด‡ ๋ชจ๋ธ์ด ์ผ๋ฐ˜์ ์œผ๋กœ ์‚ฌ์šฉ์ž๋กœ๋ถ€ํ„ฐ ๋‹จ์ผ ์ฟผ๋ฆฌ๋ฅผ ๋ฐ›๋Š” ์‹ค์ œ ์‹œ๋‚˜๋ฆฌ์˜ค๋ฅผ ๋” ์ž˜ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ํ•˜๊ธฐ ์œ„ํ•ด, ์ผ๋ฐ˜ ๋„๋ฉ”์ธ ์นดํ…Œ๊ณ ๋ฆฌ์˜ ๋ชจ๋“  benchmark๋ฅผ 0-shot ์„ค์ •์„ ์‚ฌ์šฉํ•˜์—ฌ ํ‰๊ฐ€ํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด๋ฅผ ์œ„ํ•ด ํŠน์ • ๋‹ต๋ณ€ ํ˜•์‹์„ ์š”๊ตฌํ•˜๋Š” instruction์œผ๋กœ ์–ธ์–ด ๋ชจ๋ธ๋“ค์— ํ”„๋กฌํ”„ํŠธ๋ฅผ ์ œ๊ณตํ•˜๊ณ  ์‘๋‹ต์—์„œ ์ตœ์ข… ๋‹ต๋ณ€์„ ํŒŒ์‹ฑํ–ˆ์Šต๋‹ˆ๋‹ค. ๊ณต์ •ํ•œ ๋น„๊ต๋ฅผ ์œ„ํ•ด, ๋ชจ๋“  ๋ชจ๋ธ์—์„œ ๋™์ผํ•œ ํ”„๋กฌํ”„ํŠธ๋ฅผ ์‚ฌ์šฉํ–ˆ์Šต๋‹ˆ๋‹ค.

Table 8์€ ์ผ๋ฐ˜ ๋„๋ฉ”์ธ ์นดํ…Œ๊ณ ๋ฆฌ์˜ benchmark๋“ค์—์„œ EXAONE 3.5 ์–ธ์–ด ๋ชจ๋ธ๋“ค๊ณผ ๋ฒ ์ด์Šค๋ผ์ธ ๋ชจ๋ธ๋“ค์˜ ๊ฒฐ๊ณผ๋ฅผ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค. benchmark ์ „์ฒด์˜ ํ‰๊ท ์—์„œ, 32B์™€ 78์–ต ํฌ๊ธฐ์˜ EXAONE 3.5 ์–ธ์–ด ๋ชจ๋ธ๋“ค์€ ์œ ์‚ฌํ•œ ํฌ๊ธฐ์˜ ๋ฒ ์ด์Šค๋ผ์ธ๋“ค๊ณผ ๋น„๊ตํ•˜์—ฌ ๊ฒฝ์Ÿ๋ ฅ ์žˆ๋Š” ์„ฑ๋Šฅ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค. ๋ฐ˜๋ฉด, EXAONE 3.5 24์–ต ๋ชจ๋ธ์€ ํ‰๊ท  ์ ์ˆ˜์—์„œ ๋ชจ๋“  ๋ฒ ์ด์Šค๋ผ์ธ์„ ๋Šฅ๊ฐ€ํ–ˆ์Šต๋‹ˆ๋‹ค.

  1. ์ฑ…์ž„๊ฐ ์žˆ๋Š” AI

EXAONE 3.5 ์–ธ์–ด ๋ชจ๋ธ๋“ค์€ ๊ด‘๋ฒ”์œ„ํ•œ ์‚ฌ์šฉ์ž๋“ค์—๊ฒŒ ์ œ๊ณต๋  ๊ฒƒ์˜ ํŠน์„ฑ์„ ๊ณ ๋ คํ•˜์—ฌ ๋ฐ์ดํ„ฐ ๊ฑฐ๋ฒ„๋„Œ์Šค, ์œค๋ฆฌ์  ๊ณ ๋ ค์‚ฌํ•ญ, ์œ„ํ—˜ ๊ด€๋ฆฌ๋ฅผ ํฌ๊ด„ํ•˜๋Š” ์ฑ…์ž„๊ฐ ์žˆ๋Š” AI ๊ฐœ๋ฐœ ํ”„๋ ˆ์ž„์›Œํฌ์— ๋”ฐ๋ผ ๊ฐœ๋ฐœ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ์˜คํ”ˆ ๋ชจ๋ธ์˜ ํŠน์„ฑ์ƒ ๊ฒฐ๊ตญ ๋‹ค์–‘ํ•œ ๋„๋ฉ”์ธ์—์„œ ๊ด‘๋ฒ”์œ„ํ•˜๊ฒŒ ์‚ฌ์šฉ๋  ๊ฒƒ์ด๋ฏ€๋กœ, LG AI ์œค๋ฆฌ ์›์น™์—์„œ ์š”๊ตฌํ•˜๋Š” ์ธ๊ฐ„์„ฑ, ๊ณต์ •์„ฑ, ์•ˆ์ „์„ฑ, ์ฑ…์ž„์„ฑ, ํˆฌ๋ช…์„ฑ์„ ๋ณด์žฅํ•˜๋ฉด์„œ ์‚ฌํšŒ์  ์ด์ต์„ ์ตœ๋Œ€ํ™”ํ•˜๋Š” ๊ฒƒ์„ ๋ชฉํ‘œ๋กœ ํ•ฉ๋‹ˆ๋‹ค.

4.1 ์ด์ต

EXAONE 3.5 ์–ธ์–ด ๋ชจ๋ธ๋“ค์€ AI ์—ฐ๊ตฌ ๋ฐœ์ „์„ ๋ชฉํ‘œ๋กœ ์—ฐ๊ตฌ ๋ชฉ์ ์œผ๋กœ ๊ฐœ๋ฐฉ๋˜์–ด ์žˆ์Šต๋‹ˆ๋‹ค. EXAONE 3.0 78์–ต ๋ชจ๋ธ ์ถœ์‹œ ์ดํ›„ ๋ฐ›์€ ํ”ผ๋“œ๋ฐฑ์„ ๋ฐ”ํƒ•์œผ๋กœ, ์ด์ œ 24์–ต, 78์–ต, 320์–ต์˜ ๋” ๋‹ค์–‘ํ•œ ํฌ๊ธฐ์˜ ๋ชจ๋ธ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด ์—ฐ๊ตฌ์ž๋“ค์ด ์—ฐ๊ตฌ ๋ชฉ์ ๊ณผ ์ปดํ“จํŒ… ํ™˜๊ฒฝ์— ์ตœ์ ํ™”๋œ ๋ชจ๋ธ์„ ์„ ํƒํ•  ์ˆ˜ ์žˆ๊ฒŒ ๋ฉ๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ์œ ์—ฐ์„ฑ์ด ๊ธฐ์ดˆ ์—ฐ๊ตฌ๋ถ€ํ„ฐ ๋„๋ฉ”์ธ ํŠนํ™” ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜๊นŒ์ง€ ๊ด‘๋ฒ”์œ„ํ•œ ์ŠคํŽ™ํŠธ๋Ÿผ์„ ์ง€์›ํ•˜๊ธฐ๋ฅผ ํฌ๋งํ•ฉ๋‹ˆ๋‹ค. ๋˜ํ•œ ์ด์ „ ๋ฒ„์ „๋ณด๋‹ค ์ƒ๋‹นํ•œ ์„ฑ๋Šฅ ํ–ฅ์ƒ์„ ๊ธฐ๋ฐ˜์œผ๋กœ ์ƒ์„ฑํ˜• AI์˜ ๋ฐœ์ „์— ๊ธ์ •์ ์œผ๋กœ ๊ธฐ์—ฌํ•  ๊ฒƒ์œผ๋กœ ๊ธฐ๋Œ€๋ฉ๋‹ˆ๋‹ค.

์ถœ์‹œ์˜ ์‹ ๋ขฐ์„ฑ์„ ๋ณด์žฅํ•˜๊ธฐ ์œ„ํ•ด, ๊ณ ํ’ˆ์งˆ ๋ฐ์ดํ„ฐ๋ฅผ ๋ณด์žฅํ•˜๋Š” ํ‘œ์ค€ํ™”๋œ ๋ฐ์ดํ„ฐ ์ปดํ”Œ๋ผ์ด์–ธ์Šค ํ”„๋กœํ† ์ฝœ์„ ๊ตฌํ˜„ํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ํ‘œ์ค€ํ™”๋œ ์ ‘๊ทผ๋ฒ•์€ ์—ฐ๊ตฌ์ž๋“ค์ด ํ–ฅํ›„ ๋‹ค์–‘ํ•œ ์—ฐ๊ตฌ ๋ถ„์•ผ์—์„œ ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๋Š” ์‹ ๋ขฐํ•  ์ˆ˜ ์žˆ๋Š” ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.

์™ธ๋ถ€ ์‚ฌ์šฉ์ž๋“ค์ด ๋‹ค์–‘ํ•œ ๋„๋ฉ”์ธ์—์„œ EXAONE 3.5 ์–ธ์–ด ๋ชจ๋ธ๋“ค์„ ํ™œ์šฉํ•  ์ˆ˜ ์žˆ์ง€๋งŒ, ๊ตฌ์ฒด์ ์ธ ์‚ฌ์šฉ์ž ์š”๊ตฌ๋ฅผ ์ •ํ™•ํžˆ ์‹๋ณ„ํ•˜๋Š” ๊ฒƒ์€ ์–ด๋ ค์› ์Šต๋‹ˆ๋‹ค. ์ด๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด, ๊ด‘๋ฒ”์œ„ํ•œ ๋„๋ฉ”์ธ์—์„œ์˜ ์ ์šฉ ๊ฐ€๋Šฅ์„ฑ์— ๋Œ€ํ•œ ๊ด‘๋ฒ”์œ„ํ•œ ๊ฒ€ํ† ๋ฅผ ์ˆ˜ํ–‰ํ–ˆ์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ, ๋น„์ฆˆ๋‹ˆ์Šค ๋ฐ ์—ฐ๊ตฌ ํŒ€์„ ํฌํ•จํ•œ LG ๊ณ„์—ด์‚ฌ๋“ค๊ณผ ๊ธด๋ฐ€ํžˆ ํ˜‘๋ ฅํ•˜์—ฌ ํŠน์ • ์‚ฌ์šฉ์ž ์š”๊ตฌ์‚ฌํ•ญ์— ๋” ์ž˜ ๋งž์ถ”์—ˆ์Šต๋‹ˆ๋‹ค.

4.2 ์œ„ํ—˜๊ณผ ์™„ํ™”

์˜คํ”ˆ ๋ชจ๋ธ์€ AI ์ปค๋ฎค๋‹ˆํ‹ฐ์— ๊ธ์ •์ ์œผ๋กœ ๊ธฐ์—ฌํ•  ์ˆ˜ ์žˆ์ง€๋งŒ, ์ฑ…์ž„๊ฐ ์žˆ๋Š” ์‚ฌ์šฉ์„ ๋ณด์žฅํ•˜๋Š” ๋ฐ ์–ด๋ ค์›€์ด ์žˆ์Šต๋‹ˆ๋‹ค. ์‚ฌํšŒ์ ์œผ๋กœ ์†Œ์™ธ๋œ ์ง‘๋‹จ์— ๋Œ€ํ•œ ์˜๋„ํ•˜์ง€ ์•Š์€ ๋ถˆํ‰๋“ฑ๊ณผ ์ฐจ๋ณ„, ์œ ํ•ดํ•œ ์ฝ˜ํ…์ธ  ์ƒ์„ฑ, ์‚ฌ์šฉ์ž์˜ ์•…์˜์  ์˜ค์šฉ๊ณผ ๊ฐ™์€ ์ž ์žฌ์  ์œ„ํ—˜์„ ์‹๋ณ„ํ•˜๊ธฐ ์œ„ํ•ด AI ์œค๋ฆฌ ์˜ํ–ฅ ํ‰๊ฐ€๋ฅผ ์ˆ˜ํ–‰ํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด ํ‰๊ฐ€๋ฅผ ํ†ตํ•ด ์‹๋ณ„๋œ ์ž ์žฌ์  ์œ„ํ—˜์„ ์™„ํ™”ํ•˜๊ธฐ ์œ„ํ•ด ๋‹ค์–‘ํ•œ ์ •์ฑ…๊ณผ ์—ฐ๊ตฌ ์ด๋‹ˆ์…”ํ‹ฐ๋ธŒ๋ฅผ ์ฑ„ํƒํ–ˆ์Šต๋‹ˆ๋‹ค.

์ฒซ์งธ, ๋ฐ์ดํ„ฐ ์ธก๋ฉด์—์„œ๋Š” ๊ฐœ์ธ์ •๋ณด ๋ณดํ˜ธ์™€ ๋ณด์•ˆ์„ ๊ฐ•ํ™”ํ•˜๊ธฐ ์œ„ํ•ด ๋ชจ๋“  ํ›„๋ณด ๋ฐ์ดํ„ฐ์…‹์— ๋Œ€ํ•œ ๋ฒ•์  ์œ„ํ—˜ ํ‰๊ฐ€๋ฅผ ์‹ค์‹œํ–ˆ์Šต๋‹ˆ๋‹ค. ๊ฒฐ๊ณผ๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ ๊ฐ ๋ฐ์ดํ„ฐ์…‹์˜ ํ›ˆ๋ จ ์ ํ•ฉ์„ฑ์„ ๊ฒฐ์ •ํ•˜๊ณ  ์ ๊ฒฉํ•œ ๋ฐ์ดํ„ฐ์…‹์—์„œ ๋ฏผ๊ฐํ•œ ๋ฐ์ดํ„ฐ๋ฅผ ์ œ๊ฑฐํ•˜๋Š” ๋น„์‹๋ณ„ํ™” ๊ณผ์ •์„ ์ˆ˜ํ–‰ํ–ˆ์Šต๋‹ˆ๋‹ค. ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ์˜ ํŽธํ–ฅ์„ ์ตœ์†Œํ™”ํ•˜๊ณ  ๋ฐ์ดํ„ฐ ํ’ˆ์งˆ์„ ๋ณด์žฅํ•˜๊ธฐ ์œ„ํ•ด, ๋ชจ๋“  ์ „์ฒ˜๋ฆฌ ๋‹จ๊ณ„๋ฅผ ๋ฌธ์„œํ™”ํ•˜๊ณ  ํ‘œ์ค€ํ™”๋œ ๋ฐ์ดํ„ฐ ์ฒ˜๋ฆฌ ํ”„๋กœํ† ์ฝœ์„ ์ฑ„ํƒํ–ˆ์Šต๋‹ˆ๋‹ค. ๋ชจ๋“  ๋ฐ์ดํ„ฐ์˜ ๋Œ€ํ‘œ์„ฑ์„ ๊ฒ€์ฆํ•˜๋Š” ์‹ค์งˆ์ ์ธ ์–ด๋ ค์›€์„ ๊ณ ๋ คํ•˜์—ฌ, ์†Œ๊ทœ๋ชจ ๋ฐ์ดํ„ฐ ์ƒ˜ํ”Œ์— ๋Œ€ํ•œ ์ •์„ฑ์  ํ‰๊ฐ€๋ฅผ ์ˆ˜ํ–‰ํ–ˆ์Šต๋‹ˆ๋‹ค. ์ •๋Ÿ‰์  ํ‰๊ฐ€๋ฅผ ์œ„ํ•ด์„œ๋Š” ๋ชจ๋ธ ํ›ˆ๋ จ ์™„๋ฃŒ ํ›„ ์„ฑ๋Šฅ ํ‰๊ฐ€๋ฅผ ํ†ตํ•ด ๋ฐ์ดํ„ฐ ๋ถ€๋ถ„์ง‘ํ•ฉ์„ ๊ฒ€์ฆํ•˜์—ฌ ๋ฐ์ดํ„ฐ ๊ด€๋ จ ์œ„ํ—˜์„ ์ตœ์†Œํ™”ํ•˜๋ ค๊ณ  ๋…ธ๋ ฅํ–ˆ์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ, ๋ชจ๋ธ ๊ฐœ๋ฐœ์— ์‚ฌ์šฉ๋œ ์˜คํ”ˆ์†Œ์Šค ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ๋“ค์„ ์‹ ์ค‘ํžˆ ๊ฒ€ํ† ํ–ˆ์Šต๋‹ˆ๋‹ค.

AI ์œค๋ฆฌ์  ๊ณ ๋ ค์‚ฌํ•ญ๊ณผ ๊ทœ์ œ ์š”๊ตฌ์‚ฌํ•ญ์˜ ์ˆ˜์ค€์€ ์‚ฌ์šฉ์ž์˜ ๋‹ค์–‘ํ•œ ์š”๊ตฌ์™€ ํŠน์„ฑ(์˜ˆ: ๊ฑฐ์ฃผ ๊ตญ๊ฐ€, ์—ฐ๋ น ๋“ฑ)์— ๋”ฐ๋ผ ๋‹ฌ๋ผ์งˆ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด, ๊ธ€๋กœ๋ฒŒ AI ๊ทœ์ œ๋ฅผ ์ง€์†์ ์œผ๋กœ ๋ชจ๋‹ˆํ„ฐ๋งํ•˜๊ณ  ์ž ์žฌ์ ์ธ ๊ทœ์ œ ์œ„๋ฐ˜์„ ํ”ผํ•˜๊ธฐ ์œ„ํ•ด ํ•„์š”์— ๋”ฐ๋ผ ์ฆ‰๊ฐ์ ์ธ ์กฐ์น˜๋ฅผ ์ทจํ•  ๊ฒƒ์ž…๋‹ˆ๋‹ค. AI ๋ชจ๋ธ์˜ ์˜์‚ฌ๊ฒฐ์ • ๊ณผ์ •์˜ ํˆฌ๋ช…์„ฑ ๋ถ€์กฑ์€ ์‚ฌ์šฉ์ž์™€ ์ดํ•ด๊ด€๊ณ„์ž๋“ค ์‚ฌ์ด์˜ ์‹ ๋ขฐ๋ฅผ ๊ฐ์†Œ์‹œํ‚ฌ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ํ•œ๊ณ„๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด, ์šฐ๋ฆฌ๋Š” ์•ฝ์ ๊ณผ ๊ฐœ์„  ์˜์—ญ์„ ์‹๋ณ„ํ•˜๊ธฐ ์œ„ํ•ด ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ์„ ์ง€์†์ ์œผ๋กœ ๋ถ„์„ํ•˜๊ณ  ํ‰๊ฐ€ํ•ฉ๋‹ˆ๋‹ค. AI ๋ชจ๋ธ์˜ ์˜์‚ฌ๊ฒฐ์ • ๊ณผ์ •์„ ์™„์ „ํžˆ ์„ค๋ช…ํ•˜๋Š” ๊ฒƒ์€ ์—ฌ์ „ํžˆ ์–ด๋ ต์ง€๋งŒ, ์ง€์†์ ์ธ ์—ฐ๊ตฌ๋ฅผ ํ†ตํ•ด ์„ค๋ช… ๊ฐ€๋Šฅ์„ฑ์„ ๋ฐœ์ „์‹œํ‚ค๊ธฐ ์œ„ํ•ด ๋…ธ๋ ฅํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

4.3 ์•ˆ์ „์„ฑ

ํ•œ๊ตญ ๊ณผํ•™๊ธฐ์ˆ ์ •๋ณดํ†ต์‹ ๋ถ€์™€ ํ•œ๊ตญ์ •๋ณดํ™”์ง„ํฅ์›(NIA)์—์„œ ์ œ๊ณตํ•˜๋Š” ์ œ3์ž ๋ฐ์ดํ„ฐ์…‹์ธ ํ•œ๊ตญ์–ด ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ ์‹ ๋ขฐ์„ฑ ๋ฒค์น˜๋งˆํฌ ๋ฐ์ดํ„ฐ๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ EXAONE 3.5 ์–ธ์–ด ๋ชจ๋ธ๋“ค์˜ ์œค๋ฆฌ์™€ ๋ณด์•ˆ์— ๋Œ€ํ•œ ํฌ๊ด„์ ์ธ ํ‰๊ฐ€๋ฅผ ์ˆ˜ํ–‰ํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด ๋ฐ์ดํ„ฐ์…‹์€ ์–ธ์–ด ๋ชจ๋ธ์˜ ๋ฌดํ•ด์„ฑ์„ ํ‰๊ฐ€ํ•˜๊ธฐ ์œ„ํ•ด ํŠน๋ณ„ํžˆ ์„ค๊ณ„๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ํ‰๊ฐ€ ๊ฒฐ๊ณผ๋Š” Table 9์— ์ œ์‹œ๋˜์–ด ์žˆ์Šต๋‹ˆ๋‹ค. ์„ฑ๋Šฅ์„ ์ธก์ •ํ•˜๊ธฐ ์œ„ํ•ด, ๋ชจ๋ธ์—๊ฒŒ 5๊ฐœ ์˜ต์…˜ ์ค‘ ํ•˜๋‚˜๋ฅผ ์„ ํƒํ•˜๋„๋ก ์š”์ฒญํ–ˆ์Šต๋‹ˆ๋‹ค. ์„ ํƒ๋œ ์˜ต์…˜์ด ์ •๋‹ต ์ง‘ํ•ฉ์— ํฌํ•จ๋˜๋ฉด ์ •๋‹ต์œผ๋กœ ์ ์ˆ˜๋ฅผ ๋งค๊ฒผ์Šต๋‹ˆ๋‹ค. ์ œ๊ณต๋œ ๋ฐ์ดํ„ฐ์…‹์—์„œ ์ฒ˜์Œ ๋‘ ์˜ต์…˜์€ โ€œ๊ฑฐ์ง“โ€์œผ๋กœ, ๋‚˜๋จธ์ง€ ์„ธ ๊ฐœ๋Š” โ€œ์ฐธโ€์œผ๋กœ ๋ผ๋ฒจ์ด ๋ถ™์–ด ์žˆ์—ˆ์Šต๋‹ˆ๋‹ค. ์˜ต์…˜ ์ˆœ์„œ๋กœ ์ธํ•œ ์ž ์žฌ์  ํŽธํ–ฅ์„ ์™„ํ™”ํ•˜๊ธฐ ์œ„ํ•ด, ๊ฐ ํ‰๊ฐ€๋งˆ๋‹ค ์˜ต์…˜ ์ˆœ์„œ๋ฅผ ๋ฌด์ž‘์œ„๋กœ ์„ž์—ˆ์Šต๋‹ˆ๋‹ค. ์‹คํ—˜ ๊ฒฐ๊ณผ๋Š” ์œ ํ•ดํ•œ ๋ฐ˜์‘์„ ํ•„ํ„ฐ๋งํ•˜๋Š” ๋ฐ ํšจ๊ณผ์„ฑ์„ ๋ณด์—ฌ์ฃผ์—ˆ์ง€๋งŒ, ์—ฌ์ „ํžˆ ๊ฐœ์„ ์˜ ์—ฌ์ง€๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค.

  1. ํ•œ๊ณ„

EXAONE 3.5 ์–ธ์–ด ๋ชจ๋ธ๋“ค์€ ๊ธฐ์กด์˜ ๋ชจ๋“  ์–ธ์–ด ๋ชจ๋ธ๋“ค๊ณผ ๋งˆ์ฐฌ๊ฐ€์ง€๋กœ ํŠน์ •ํ•œ ํ•œ๊ณ„๊ฐ€ ์žˆ์œผ๋ฉฐ ๋•Œ๋•Œ๋กœ ๋ถ€์ ์ ˆํ•œ ์‘๋‹ต์„ ์ƒ์„ฑํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์–ธ์–ด ๋ชจ๋ธ์€ ํ† ํฐ์˜ ์ถœ๋ ฅ ํ™•๋ฅ ์„ ๊ธฐ๋ฐ˜์œผ๋กœ ์‘๋‹ต์„ ์ƒ์„ฑํ•˜๋ฉฐ, ์ด๋Š” ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ์—์„œ์˜ ํ•™์Šต ์ค‘์— ๊ฒฐ์ •๋ฉ๋‹ˆ๋‹ค. ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ์—์„œ ๊ฐœ์ธ์ , ์œ ํ•ดํ•œ, ํŽธํ–ฅ๋œ ์ •๋ณด๋ฅผ ์ œ์™ธํ•˜๊ธฐ ์œ„ํ•ด ๋ชจ๋“  ๋…ธ๋ ฅ์„ ๊ธฐ์šธ์˜€์ง€๋งŒ, ์ผ๋ถ€ ๋ฌธ์ œ๊ฐ€ ์žˆ๋Š” ์ฝ˜ํ…์ธ ๊ฐ€ ์—ฌ์ „ํžˆ ํฌํ•จ๋˜์–ด ๋ฐ”๋žŒ์งํ•˜์ง€ ์•Š์€ ์‘๋‹ต์œผ๋กœ ์ด์–ด์งˆ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. EXAONE 3.5 ์–ธ์–ด ๋ชจ๋ธ๋“ค์ด ์ƒ์„ฑํ•˜๋Š” ํ…์ŠคํŠธ๋Š” LG AI Research์˜ ๊ฒฌํ•ด๋ฅผ ๋ฐ˜์˜ํ•˜์ง€ ์•Š๋Š”๋‹ค๋Š” ์ ์„ ์œ ์˜ํ•˜์‹œ๊ธฐ ๋ฐ”๋ž๋‹ˆ๋‹ค.

โ€ข ๊ฐœ์ธ์ , ์œ ํ•ดํ•œ ๋˜๋Š” ๊ธฐํƒ€ ๋ถ€์ ์ ˆํ•œ ์ •๋ณด๋ฅผ ํฌํ•จํ•˜๋Š” ๋ถ€์ ์ ˆํ•œ ๋‹ต๋ณ€์ด ์ƒ์„ฑ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
โ€ข ๋‚˜์ด, ์„ฑ๋ณ„, ์ธ์ข… ๋“ฑ๊ณผ ๊ด€๋ จ๋œ ํŽธํ–ฅ๋œ ์‘๋‹ต์ด ์ƒ์„ฑ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
โ€ข ์ƒ์„ฑ๋œ ์‘๋‹ต์€ ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ์˜ ํ†ต๊ณ„์— ํฌ๊ฒŒ ์˜์กดํ•˜๋ฏ€๋กœ, ์˜๋ฏธ์ ์œผ๋กœ๋‚˜ ๊ตฌ๋ฌธ์ ์œผ๋กœ ์ž˜๋ชป๋œ ๋ฌธ์žฅ์ด ์ƒ์„ฑ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
โ€ข ๋ชจ๋ธ๋“ค์ด ์ตœ์‹  ์ •๋ณด๋ฅผ ๋ฐ˜์˜ํ•˜์ง€ ์•Š์œผ๋ฏ€๋กœ, ์‘๋‹ต์ด ๊ฑฐ์ง“์ด๊ฑฐ๋‚˜ ๋ชจ์ˆœ์ ์ผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

LG AI Research๋Š” EXAONE 3.5 ์–ธ์–ด ๋ชจ๋ธ๋“ค๋กœ๋ถ€ํ„ฐ ๋ฐœ์ƒํ•  ์ˆ˜ ์žˆ๋Š” ์ž ์žฌ์  ์œ„ํ—˜์„ ์ค„์ด๊ธฐ ์œ„ํ•ด ๋…ธ๋ ฅํ•ฉ๋‹ˆ๋‹ค. ์‚ฌ์šฉ์ž๋“ค์€ EXAONE 3.5 ์–ธ์–ด ๋ชจ๋ธ๋“ค์„ ์‚ฌ์šฉํ•  ๋•Œ LG AI์˜ ์œค๋ฆฌ ์›์น™์„ ์œ„๋ฐ˜ํ•˜๋Š” ๋ถ€์ ์ ˆํ•œ ์ถœ๋ ฅ ์ƒ์„ฑ์„ ์œ ๋„ํ•  ์ˆ˜ ์žˆ๋Š” ์•…์˜์  ํ™œ๋™(์˜ˆ: ๋ถˆ๋ฒ• ์ •๋ณด ์ž…๋ ฅ)์— ์ฐธ์—ฌํ•ด์„œ๋Š” ์•ˆ ๋ฉ๋‹ˆ๋‹ค.

  1. ๋ฐฐํฌ

Appendix์˜ Section B๋Š” EXAONE 3.5 ์–ธ์–ด ๋ชจ๋ธ๋“ค ์‚ฌ์šฉ์„ ์œ„ํ•œ ๋ผ์ด์„ ์Šค ์ •๋ณด๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. ์–ธ์–ด ๋ชจ๋ธ์˜ ๋ฒ•์  ํ™œ์šฉ์„ ์œ„ํ•ด์„œ๋Š” ๋ผ์ด์„ ์Šค ์ •๋ณด๋ฅผ ์ดํ•ดํ•˜๋Š” ๊ฒƒ์ด ํ•„์ˆ˜์ ์ž…๋‹ˆ๋‹ค.

  1. ๊ฒฐ๋ก 

ํ•™๊ณ„์™€ ์‚ฐ์—…๊ณ„์˜ ์ฆ๊ฐ€ํ•˜๋Š” ๊ด€์‹ฌ์— ์‘๋‹ตํ•˜์—ฌ, ์‹ค์ œ ์‚ฌ์šฉ ์‚ฌ๋ก€์™€ long-context ์ดํ•ด์—์„œ ๋›ฐ์–ด๋‚œ ์„ฑ๋Šฅ์„ ๋ณด์ด๋Š” EXAONE 3.5 ์–ธ์–ด ๋ชจ๋ธ๋“ค์„ ์ถœ์‹œํ•˜๊ฒŒ ๋˜์–ด ๊ธฐ์ฉ๋‹ˆ๋‹ค. ์ด ๋ชจ๋ธ๋“ค์€ ์„ธ ๊ฐ€์ง€ ํฌ๊ธฐ(32B, 7.8B, 2.4B)๋กœ ์ œ๊ณต๋ฉ๋‹ˆ๋‹ค.

์‹ค์ œ ์‚ฌ์šฉ ์‚ฌ๋ก€ ์‹œ๋‚˜๋ฆฌ์˜ค์—์„œ ์šฐ๋ฆฌ ๋ชจ๋ธ๋“ค์˜ ์„ฑ๋Šฅ์„ ๊ฒ€์ฆํ•˜๊ธฐ ์œ„ํ•ด, ๋‹ค์–‘ํ•œ instruction ์ดํ•ด๊ฐ€ ํ•„์š”ํ•œ 7๊ฐœ์˜ benchmark์—์„œ ๋ชจ๋ธ๋“ค์„ ํ‰๊ฐ€ํ–ˆ์Šต๋‹ˆ๋‹ค. Long-context ์ดํ•ด๋ฅผ ํ‰๊ฐ€ํ•˜๊ธฐ ์œ„ํ•ด, 4๊ฐœ์˜ benchmark์—์„œ ๋ชจ๋ธ๋“ค์„ ํ‰๊ฐ€ํ–ˆ์Šต๋‹ˆ๋‹ค. ์šฐ๋ฆฌ ๋ชจ๋ธ๋“ค์€ ๋‘ ์นดํ…Œ๊ณ ๋ฆฌ ๋ชจ๋‘์—์„œ ์ผ๊ด€๋˜๊ฒŒ ๋›ฐ์–ด๋‚œ ์„ฑ๋Šฅ์„ ๋ณด์˜€์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ, ์šฐ๋ฆฌ ๋ชจ๋ธ๋“ค์€ ์ˆ˜ํ•™ ๋ฌธ์ œ ํ•ด๊ฒฐ๊ณผ ์ฝ”๋“œ ์ž‘์„ฑ์„ ํฌํ•จํ•œ ์ผ๋ฐ˜ ๋„๋ฉ”์ธ์—์„œ ๊ฒฝ์Ÿ๋ ฅ ์žˆ๋Š” ์„ฑ๋Šฅ์„ ๋ณด์˜€์Šต๋‹ˆ๋‹ค. ํŠนํžˆ, ์šฐ๋ฆฌ์˜ 24์–ต ๋ชจ๋ธ์€ ์ผ๋ฐ˜ ๋„๋ฉ”์ธ์—์„œ ํ‰๊ท  ์ ์ˆ˜ 1์œ„๋ฅผ ์ฐจ์ง€ํ–ˆ์Šต๋‹ˆ๋‹ค.

์šฐ๋ฆฌ ๋ชจ๋ธ๋“ค์€ ์—ฐ๊ตฌ ๋ชฉ์ ์œผ๋กœ ๋ชจ๋“  ๋ถ„๋“ค์—๊ฒŒ ์ œ๊ณต๋˜๋ฉฐ, ๋ชจ๋ธ ๊ฐœ์„ ์— ๋„์›€์ด ๋  ํ”ผ๋“œ๋ฐฑ์„ ํ™˜์˜ํ•ฉ๋‹ˆ๋‹ค. ํ”ผ๋“œ๋ฐฑ์ด ์žˆ๊ฑฐ๋‚˜ ์šฐ๋ฆฌ ๋ชจ๋ธ๋“ค๊ณผ์˜ ์ƒ์—…์  ๊ธฐํšŒ ํƒ์ƒ‰์— ๊ด€์‹ฌ์ด ์žˆ์œผ์‹œ๋ฉด contact_us@lgresearch.ai๋กœ ์—ฐ๋ฝํ•ด ์ฃผ์‹œ๊ธฐ ๋ฐ”๋ž๋‹ˆ๋‹ค.



-->