OpenAI, o3 & o4-mini ๊ณต๊ฐ: AI ์ถ๋ก ์ ์งํ
์๋ณธ ๊ฒ์๊ธ: https://velog.io/@euisuk-chung/OpenAI-o3-o4-mini-๊ณต๊ฐ-AI-์ถ๋ก ์-์งํ
OpenAI๊ฐ o3์ o4-mini ๋ชจ๋ธ์ ๊ณต๊ฐํ๋ฉฐ, ์ด์ AI๋ ๋จ์ํ ์์ฑ๊ธฐ์์ ๋ฒ์ด๋ ๋ณต์กํ ๋ฌธ์ ๋ฅผ ๋ฅ๋์ ์ผ๋ก ํด๊ฒฐํ๋ ํฉ๋ฆฌ์ ์ถ๋ก ์์คํ ์ผ๋ก ๋ฐ์ ํ๊ณ ์์ต๋๋ค.
๊ธฐ๋ณธ GPT ์๋ฆฌ์ฆ์ ๋ฌ๋ฆฌ, o-์๋ฆฌ์ฆ๋ ๋ฌธ์ ํด๊ฒฐ์ ์์ด โ๋๊ตฌ๋ฅผ ํ์ฉํ ๊น์ด ์๋ ์ฌ๊ณ โ๋ฅผ ๊ธฐ๋ณธ ์ ์ ๋ก ํ๋ฉฐ, ๋ฐ๋ณต์ ์ธ ํด ํธ์ถ์ ํตํด ์งํํ ์ถ๋ก ์ ์ํํ๋ ๊ฒ์ด ํน์ง์ ๋๋ค.
์ด ๊ธ์์๋ ๋ฐํ๋ LIVESTREAM ํ๋ฆ์ ์ค์ฌ์ผ๋ก ๊ธฐ์ ์ ๋ฐฐ๊ฒฝ, ๋ฐ๋ชจ, ์ฑ๋ฅ ์งํ ๋ฐ ํ์ฉ ์ฌ๋ก, ์ ๋ง์ ์ข ํฉ ์ ๋ฆฌํฉ๋๋ค.
-
์ o-์๋ฆฌ์ฆ์ธ๊ฐ?
OpenAI๋ ๋จ์ํ ์ธ์ด ์์ฑ ์ด์์ ๊ธฐ๋ฅ์ ์ํํ ์ ์๋ ์๋ก์ด AI ๋ชจ๋ธ๊ตฐ์ธ o-์๋ฆฌ์ฆ๋ฅผ ํตํด, ์ง์ ํ ์๋ฏธ์์์ ์์ด์ ํธ ๊ธฐ๋ฐ ์ถ๋ก ์์คํ ์ ์ ์ํ๊ณ ์์ต๋๋ค.
- GPT ์๋ฆฌ์ฆ๋ฅผ ๋์ด์: ๊ธฐ์กด GPT ๋ชจ๋ธ๋ค์ด ์ฃผ๋ก ์์ฐ์ด ์์ฑ์ ์ด์ ์ ๋ง์ท๋ค๋ฉด, o ์๋ฆฌ์ฆ๋ ๋ฅ๋์ ์ผ๋ก ๋ฌธ์ ๋ฅผ ๊ตฌ์กฐํํ๊ณ , ํ์ ์ ์ธ๋ถ ๋๊ตฌ๋ฅผ ๋ถ๋ฌ์ ๋ณตํฉ์ ์ธ ์์ ์ ์ํํฉ๋๋ค.
- ์ธ๊ฐ์ฒ๋ผ โ์๊ฐํ๊ณ ๋๊ตฌ๋ฅผ ์ฐ๋โ ๋ฐฉ์์ผ๋ก ์ค๊ณ๋์ด ์์ผ๋ฉฐ, ์ค์ ๋ก o3๋ ํ๋์ ๋ฌธ์ ํด๊ฒฐ์ ์ํด 600๋ฒ ์ด์์ ํด ํธ์ถ์ ์คํํ ์ฌ๋ก๊ฐ ์กด์ฌํฉ๋๋ค.
๐ ํต์ฌ ๋ฉ์์ง: o3/o4-mini๋ ๋จ์ LLM์ด ์๋๋ผ, ๋๊ตฌ ๊ธฐ๋ฐ ์ถ๋ก ์ ์๋ํํ๋ AI ์์คํ , ์ฆ โAI ์์ ์โ์ ์ฒซ ์ฌ๋ก๋ผ ๋ณผ ์ ์์ต๋๋ค.
-
๊ธฐ์ ์ฒ ํ๊ณผ ๋ชจ๋ธ ์ํคํ ์ฒ
๐ง ์ธ๊ฐ์ฒ๋ผ โ๋จ๊ณ์ ์ผ๋ก ์ฌ๊ณ ํ๊ณ ํ๋ํ๋โ ๊ตฌ์กฐ
- ๋ฉํฐ๋ชจ๋ฌ ํตํฉ ์ถ๋ก : ํ ์คํธ, ์ฝ๋, ์ด๋ฏธ์ง, ์ธ๋ถ ๋๊ตฌ๋ฅผ ๊ฒฐํฉํ์ฌ ์ฌ๊ณ ์ฒด๊ณ๋ฅผ ๊ตฌ์ฑํฉ๋๋ค.
-
ํด ๊ธฐ๋ฐ ์ฐ์ ์ถ๋ก (Chain-of-Tool Use): ๋ฌธ์ ๋ฅผ ๋จ๊ณ์ ์ผ๋ก ๋๋๊ณ , ๋๊ตฌ๋ฅผ ํธ์ถํ์ฌ ๊ฐ ๋จ๊ณ๋ฅผ ํด๊ฒฐํ๋ ๋ฐฉ์์ ์ธ๊ฐ์ ๋ถ์์ ๋ฌธ์ ํด๊ฒฐ ๋ฐฉ์๊ณผ ์ ์ฌํฉ๋๋ค.
- ์์: ๋ ผ๋ฌธ ํฌ์คํฐ ์ด๋ฏธ์ง โ ์ด๋ฏธ์ง ๋ถ์ โ ๊ทธ๋ํ ๊ฐ ์ถ์ถ โ ๊ด๋ จ ๋ ผ๋ฌธ ๊ฒ์ โ ๊ฒฐ๊ณผ ๋น๊ต โ ์์ฝ ๋ฆฌํฌํธ ์์ฑ๊น์ง ์ ๊ณผ์ ์๋ํ ๊ฐ๋ฅ.
- LangGraph ๊ธฐ๋ฐ์ Agentic Architecture์ ์ ์ฌ: ์ํ ๊ธฐ๋ฐ ํ๋ฆ๊ณผ ๋ฐ๋ณต์ ํด ํธ์ถ์ ํตํด ์ ์ง์ ์ผ๋ก ๋ชฉํ๋ฅผ ํฅํด ๋์๊ฐ.
-
์ฑ๋ฅ ์งํ ๋ฐ ๋ฒค์น๋งํฌ ์ฑ๊ณผ
๋ฒค์น๋งํฌ ์ฑ๋ฅํ
๋ชจ๋ธ | ์ฃผ์ ์ฑ๋ฅ | ์ค๋ช |
---|---|---|
o4-mini | AIME 99% | ๋ฏธ๊ตญ ๊ณ ๊ธ ์ํ ๊ฒฝ์๋ํ ์ ๋ต๋ฅ 99%, ๊ณ ๋์ด๋ ์ํ ๋ฌธ์ ์์ SOTA |
o3 | Codeforces 2,700+ | ์ธ๊ณ ์ต๊ณ ์์ค ์๊ณ ๋ฆฌ์ฆ ์ค๋ ฅ, ์์ 200์๊ถ ์์ค |
o3 | GPQA 83% | ๋ฐ์ฌ๊ธ ๊ณผํ ๋ฌธ์ ํด๊ฒฐ ์ ํ๋, ์ถ๋ก ๋ฅ๋ ฅ ๊ทน๋ํ |
o4-mini | SWE-bench SOTA | GitHub ๊ธฐ๋ฐ ์๋ ๋ฒ๊ทธ ์์ ์์ ์ต๊ณ ์ฑ๋ฅ |
o4-mini | ๋ฉํฐ๋ชจ๋ฌ SOTA | ์ํ+์ด๋ฏธ์ง ๋ณตํฉ ํ๊ฐ(MMMU, MathVista ๋ฑ) ์ ์์ญ ์ฐ์ํ ์ฑ์ |
-
์ค์ ๋ฐ๋ชจ ์ฌ๋ก
๐ป 1) ๋ฒ๊ทธ ์์ ์๋ํ (SymPy ์ ์ฅ์)
- CLI ํ๊ฒฝ์์ ์คํ์์ค ์ ์ฅ์ ๋ถ๋ฌ์ค๊ธฐ โ ๊ตฌ์กฐ ํ์ โ ์ค๋ฅ ์ง๋จ ๋ฐ ํด๊ฒฐ ์ฝ๋ ์์ฑ โ ์ ๋ ํ ์คํธ ์คํ โ PR ์ด์ ์๋ ์์ฑ.
- ์ธ๊ฐ์ด ํ๋ฏ ์ค๋ฅ์ ๋ฐ์ ๊ฒฝ๋ก(MRO) ์ถ์ ํ, ์ ์ ํ ํจ์น ์์ฑ ๋ฐ ๊ฒ์ฆ.
- ์:
Max(2, x)
๋ฅผMax[x, 2]
๋ก ์๋ ๊ต์ ํ๋ Mathematica ํํ์ ๋๋ฒ๊น ์ฌ๋ก ํฌํจ.
๐ 2) ์ฐ๊ตฌ ํฌ์คํฐ ๋ถ์ ๋ณด์กฐ
- ๋ํ์์ ๋
ผ๋ฌธ ํฌ์คํฐ PDF๋ฅผ ์
๋ก๋ โ ์ฐจํธ ์ด๋ฏธ์ง ๋ถ์ โ ๊ฐ ์ถ์ โ ๊ด๋ จ ๋
ผ๋ฌธ ๊ฒ์ โ ์์ ์ ๊ฒฐ๊ณผ์ ๋น๊ต.
- ๋น์ ๊ณต์๋ ํ์ ์ ๋ณด ํ์๊ณผ ๋น๊ต ํ๊ฐ๊น์ง ๊ฐ๋ฅ.
๐ฐ 3) ๋ง์ถคํ ์ ๋ณด ํ์
- ์ฌ์ฉ์์ ์ทจ๋ฏธ๋ ์ฐ๊ตฌ ๊ด์ฌ์ฌ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ๋ด์ค ์์ฝ ๋ฐ ์ต์ ์ฐ๊ตฌ ์๊ฐ.
-
์: ๋ด๊ฐ ๊ด์ฌ์์ ๋งํ ์ ๋ณด ํ์
โ AI๊ฐ ๊ด๋ จ ๋ธ๋ก๊ทธ ์ด์๊ณผ ๊ทธ๋ํ ์์ฑ.
๐จ 4) ๋ฉํฐ๋ชจ๋ฌ ์ฑ ์์ฑ
- macOS์ Photo Booth ํํฐ ํ๋ฉด์ ์บก์ฒํ์ฌ CLI์ ์ ๋ ฅ.
- Codex๋ ์ด๋ฅผ ๋ถ์ํ์ฌ ์น์ฑ ๊ตฌ์กฐ ์์ฑ โ ์น์บ API ์ฐ๋ โ HTML + JS ๊ธฐ๋ฐ ํ์ด์ง ์๋ ๊ตฌ์ฑ.
๐ ๋จ์ํ UI ์บก์ฒ๋ง์ผ๋ก ์์ฑ๋ ๋์ ์น์ฑ์ ์๋ ์์ฑํ๋ ๋ฅ๋ ฅ์ ์ง์ ํ Agentic UX ๊ฐ๋ฐ์ ์ฒซ ์ฌ๋ก๋ก ์ฃผ๋ชฉ๋ฉ๋๋ค.
๐งฎ 5) ์ํ ๋ฌธ์ ๋ธ๋ฃจํธ ํฌ์ค ํด๊ฒฐ
- 2ร2 ๊ฒฉ์์ ์๋ 4๊ฐ์ ์ ์ฌ๊ฐํ์ ํ ๋๋ฆฌ๋ฅผ ๋นจ๊ฐ์๊ณผ ํ๋์์ผ๋ก ์์น ํ๋ ๋ฌธ์ .
- ๊ฐ ์ฌ๊ฐํ์ ์ ํํ 2๊ฐ์ ๋นจ๊ฐ ๋ณ + 2๊ฐ์ ํ๋ ๋ณ์ ๊ฐ์ ธ์ผ ํ๋ฉฐ, ์ ์ฒด ์กฐ๊ฑด์ ๋ง์กฑํ๋ ์์น ๋ฐฉ๋ฒ์ ์๋ฅผ ๊ณ์ฐ.
-
o3 ๋ชจ๋ธ์ ์ด ๋ฌธ์ ๋ฅผ Python ๋ธ๋ฃจํธ ํฌ์ค ์ฝ๋๋ก ํด๊ฒฐ:
- 12๊ฐ์ ์ ๋ถ ๊ฐ๊ฐ์ ๋ํด ๋นจ๊ฐ์/ํ๋์ ํ ๋น์ 0 ๋๋ 1๋ก ์ค์ .
- ๋ชจ๋ ๊ฒฝ์ฐ์ ์(2ยนยฒ = 4096)๋ฅผ ํ์ํ์ฌ ์กฐ๊ฑด์ ๋ง๋ ๊ฒฝ์ฐ๋ง ํํฐ๋ง.
- ์ ํจํ ์กฐํฉ์ ์ด 82๊ฐ์ง๋ก ์ถ๋ ฅ๋จ.
1
2
3
4
5
6
7
8
9
count = 0
solutions = []
for a in [0, 1]:
for b in [0, 1]:
...
for l in [0, 1]:
if ์กฐ๊ฑด์ ๋ง์กฑ:
count += 1
solutions.append((a,b,...,l))
- ๋จ์ ๊ณ์ฐ ์ด์์ผ๋ก, ๋ชจ๋ธ์ ๋ฌธ์ ์ ์ โ ๋ณ์ ์ค์ โ ๋ฐ๋ณต ๊ตฌ์กฐ โ ์กฐ๊ฑด ๊ตฌ์ฑ โ ๊ฒฐ๊ณผ ํด์๊น์ง ์์ ํ ์ฌ๊ณ ๋ฅผ ์ํํ์ผ๋ฉฐ, ์ดํ ์ด ์ฝ๋๋ฅผ ๋ฆฌํฉํ ๋งํด ๋ ํจ์จ์ ์ธ ๋ฐฉ์๋ ์ ์ํจ.
๐ ์ด ๋ฐ๋ชจ๋ o3์ ์ํ์ ์ถ๋ก + ์ฝ๋ ์์ฑ ๋ฅ๋ ฅ์ด ๊ฒฐํฉ๋ ๋ํ ์ฌ๋ก๋ก, Agentํ ๋ชจ๋ธ์ด ๋ฌธ์ ํด๊ฒฐ ๋ฅ๋ ฅ์ ์ค์ ๋ก ์ด๋ป๊ฒ ๋ณด์ฌ์ฃผ๋์ง๋ฅผ ์ ์ฆํฉ๋๋ค.
-
๋น์ฉ ๋๋น ์ถ๋ก ํจ์จ์ฑ ๋น๊ต (Cost-Efficient Reasoning)
๊ณต๊ฐ๋ ๊ทธ๋ํ๋ฅผ ํตํด, OpenAI๋ o4-mini, o3, o1 ๋ฑ ๊ฐ ๋ชจ๋ธ์ ์ถ๋ก ์ ํ๋ vs ๋น์ฉ ๊ณก์ ์ ๋น๊ตํ๋ฉฐ, o-์๋ฆฌ์ฆ ๋ชจ๋ธ์ด ํนํ ์ ๋น์ฉ ๊ณ ์ ํ๋ ์ถ๋ก ์ ์ ๋ฆฌํ๋ค๋ ์ ์ ๊ฐ์กฐํฉ๋๋ค.
(์ฐธ๊ณ ) AIME (American Invitational Mathematics Examination)๋ ๋ฏธ๊ตญ ๊ณ ๋ฑํ์์ ๋์์ผ๋ก ํ ์ํ ๊ฒฝ์๋ํ ์ค ํ๋๋ก, AMC (American Mathematics Competitions) ์๋ฆฌ์ฆ์ ์์ ๋ผ์ด๋์ ํด๋นํฉ๋๋ค.
AIME (๋ฏธ๊ตญ ์ํ ๊ฒฝ์) ๊ธฐ์ค
- o4-mini๋ lowโmediumโhigh๋ก ๊ฐ์๋ก ์ ํ๋ ์์น.
- ๋์ผํ ์กฐ๊ฑด์์ o3-mini ๋๋น ๋น ๋ฅธ ์ฑ๋ฅ ํฅ์ ๊ณก์ .
GPQA (๊ณผํ๋ฌธ์ ์ ํ๋) ๊ธฐ์ค
- o4-mini์ o3-mini ๋ชจ๋ ํด ์์ด๋ ๋์ ์ ํ๋๋ฅผ ๋ฌ์ฑ.
- o1 ๋๋น ๋์ผ ์ฑ๋ฅ์์ ๋น์ฉ์ด ์ ๋ฐ ์ดํ.
์ข ํฉ ๋น๊ต
- o4-mini๋ ์ ์ฒด ๋ชจ๋ธ ์ค์์ ๊ฐ์ฅ ๋น ๋ฅธ ์ฑ๋ฅ ํฅ์์ ๋ณด์ด๋ฉฐ, ํนํ medium/low ๋จ๊ณ์์ ๋น์ฉ ๋๋น ์ฑ๋ฅ ์ฐ์๊ฐ ๋๋ ทํ๊ฒ ๋ํ๋จ.
- o3๋ ์ฑ๋ฅ ๋ฉด์์๋ ์ต๊ณ ์ง๋ง ๋น์ฉ์ ์๋์ ์ผ๋ก ๋์.
๐ inference ํจ์จ์ฑ๊ณผ ์ ๋ต๋ฅ ์ฌ์ด์์ o4-mini๋ ์ต๊ณ ์ ๊ท ํ์ ์ผ๋ก ํฌ์ง์ ๋๋ฉ๋๋ค.
-
AIME ์ฑ๋ฅ ํฅ์ ๊ทธ๋ํ (ํ์ต ์ค ๋ณํ)
ํด๋น ๊ทธ๋ํ๋ OpenAI ๋ชจ๋ธ๋ค์ด ํ๋ จ ์ค AIME ์ํ ๋ฌธ์ ์ ๋ํ Pass@1 ์ ํ๋๊ฐ ์ด๋ป๊ฒ ๋ณํํ๋์ง๋ฅผ ๋ํ๋ ๋๋ค.
- X์ถ: ์ฌ์ฉ๋ ์ฐ์ฐ ์์(Compute) (๋ก๊ทธ ์ค์ผ์ผ)
- Y์ถ: Pass@1 ์ ํ๋ (๋จ ํ ๋ฒ ์๋๋ก ์ ๋ต ๋ง์ถ ๋น์จ)
๊ทธ๋ํ ํด์
- o1 โ o3๋ก ๊ฐ์๋ก ๋์ผ compute ์์ค์์๋ ์ฑ๋ฅ์ด ๋น์ฝ์ ์ผ๋ก ํฅ์๋จ
- o3๋ ์ฝ 90%์ ์ ํ๋๋ก AIME 2022/2023 ๋ฌธ์ ๋ฅผ ํด๊ฒฐ ๊ฐ๋ฅํจ
- ์ ์ง์ ํ๋ จ์ ํตํด ์ถ๋ก ๋ฅ๋ ฅ์ ์ ์ฐจ์ ์ผ๋ก ๊ณ ๋ํํ๋ ํ์ต ๋ฐฉ์์ด ํจ๊ณผ์ ์ด์์์ ๋ณด์ฌ์ค
AIME๋?
- American Invitational Mathematics Examination์ ์ฝ์๋ก, ๋ฏธ๊ตญ ์ํ ๊ฒฝ์๋ํ์ ์์ ๋ผ์ด๋
- ๋ฌธ์ ๋์ด๋๊ฐ ๋งค์ฐ ๋๊ณ , ์ถ๋ก ๋ฅ๋ ฅ๊ณผ ๋ ผ๋ฆฌ์ ์ฌ๊ณ ๋ ฅ์ ์ค์ ์ ์ผ๋ก ํ๊ฐ
- LLM ์ฑ๋ฅ ํ๊ฐ ์งํ๋ก ์ฌ์ฉ๋๊ธฐ ์ ํฉ (๋จ์ ์์์ด ์๋ ์ฌ๊ณ ๊ธฐ๋ฐ ๋ฌธ์ ํด๊ฒฐ ์๊ตฌ)
๐ฏ ํด๋น ๊ฒฐ๊ณผ๋ o-์๋ฆฌ์ฆ ๋ชจ๋ธ์ด ๋จ์ํ ํ ์คํธ ์์ธก์ด ์๋, ์ง์์ ์ธ ํ๋ จ์ ํตํด ์ถ๋ก ์ค์ฌ์ ๋ฌธ์ ํด๊ฒฐ ๋ฅ๋ ฅ์ ํ๋ํด ๋๊ฐ๋ ๊ณผ์ ์ ๋ฐ์ดํฐ๋ก ์ ์ฆํ ๊ฒ์ ๋๋ค.
-
Codex CLI: ์ง์ง ์ฝ๋ฉ ๋๋ฃ์ ๋ฑ์ฅ
(์ฐธ๊ณ ) https://youtu.be/FUq9qRwrDrI
OpenAI๋ Codex CLI๋ฅผ ํตํด ๋ก์ปฌ์์ ์คํ ๊ฐ๋ฅํ ๊ฐ๋ฒผ์ด ์ฝ๋ฉ ์์ด์ ํธ๋ฅผ ๊ณต๊ฐํ์ต๋๋ค.
-
GitHub MIT ์คํ์์ค ๋ผ์ด์ ์ค: ๋๊ตฌ๋ ์์ ๋กญ๊ฒ ์ฌ์ฉ ๋ฐ ํ์ฅ ๊ฐ๋ฅ
โ ์ฝ๋ ๋ณด๊ธฐ
- ๋ค์ํ ๋ชจ๋ธ ์ง์: GPT-4.1, o3, o4-mini ํธํ
- ๋ก์ปฌ์์ ์ฝ๋ ํธ์งยท์คํยทํ์ผ ๋ณ๊ฒฝยทํ ์คํธ๊น์ง ๊ฐ๋ฅ
- ํ ์คํ ๋ชจ๋ ์ง์: ์ฌ์ฉ์๊ฐ ์๋ฌด ์ ๋ ฅ ์์ด๋ ํ๋ก์ ํธ ํ์, ์์ , ์คํ๊น์ง ์๋ํ ๊ฐ๋ฅ
- ๋ณด์ ์ค์ : ๋คํธ์ํฌ ๋นํ์ฑํ + ์๋๋ฐ์ค ๋๋ ํฐ๋ฆฌ๋ก ์์ ํ๋ณด
๊ธฐ๋ฅ | ์ค๋ช |
---|---|
์คํ ํ๊ฒฝ | ๋ก์ปฌ ํฐ๋ฏธ๋, API ํค๋ง์ผ๋ก ์คํ ๊ฐ๋ฅ |
์ง์ ๋ชจ๋ธ | GPT-4.1, o3, o4-mini ๋ชจ๋ ์ง์ |
๋ฉํฐ๋ชจ๋ฌ ์ ๋ ฅ | ์คํฌ๋ฆฐ์ท + ๋ช ๋ น์ด โ ์ฝ๋ ์์ฑ ๋ฐ ๊ธฐ๋ฅ ๊ตฌํ |
๋ณด์ | ์๋ ๋คํธ์ํฌ ์ฐจ๋จ + ์์ ํด๋ ๋ณดํธ |
๐ง Codex CLI๋ ๋จ์ํ CLI ํด์ด ์๋๋ผ, ํฐ๋ฏธ๋์์ ์๋ํ๋ ๊ฐ๋ฐ์์ฉ Copilot + ๋ฉํฐ๋ชจ๋ฌ Reasoning Agent์ ๋๋ค.
-
๋ชจ๋ธ ๊ฐ๊ฒฉ ๋ฐ ๋น๊ต (2025.04 ๊ธฐ์ค)
๋ชจ๋ธ | ์ ๋ ฅ 1M | ์ถ๋ ฅ 1M | Context | Max Tokens | Knowledge Cutoff |
---|---|---|---|---|---|
o4-mini | $1.10 | $4.40 | 200K | 100K | 2024.06 |
o3 | $10.00 | $40.00 | 200K | 100K | 2024.06 |
o3-mini | $1.10 | $4.40 | 200K | 100K | 2023.10 |
gpt-4.1 | $2.00 | $8.00 | 1M+ | 32K | 2024.06 |
- o4-mini๋ ์ฑ๋ฅยท์๋ยท๋น์ฉ์ ์ต์ ๊ท ํ์ ์ ์ ๊ณตํ๋ฉฐ, ๊ณ ๋ํ๋ ๋ฉํฐ๋ชจ๋ฌ ์ถ๋ก ๊น์ง ๊ฐ๋ฅ
-
ํฅํ ์ ๋ง ๋ฐ ๊ตฌ์กฐ์ ๋ณํ
๐งฉ Agentic RAG & ์๋ํ ์ํฌํ๋ก์ฐ
- o4-mini์ Codex CLI์ ์กฐํฉ์ ๊ฒ์ โ ๋ถ์ โ ์์ฝ โ ์ฝ๋ ์์ฑ โ ์๊ฐํ โ PR ์์ฑ๊น์ง ์ด์ด์ง๋ ์ํฌํ๋ก์ฐ๋ฅผ ์๋ํ
- ํนํ RAG ํ์ดํ๋ผ์ธ์์ ๋จ์ ํ ์คํธ ๋ต๋ณ ์์ฑ์ด ์๋๋ผ, ๋๊ตฌ๋ฅผ ํตํ ์คํ ๊ธฐ๋ฐ ์๋ต์ด ๊ฐ๋ฅ
๐ ๊ต์ก ๋ฐ ์ฐ๊ตฌ ๋ณด์กฐ ๋ฏผ์ฃผํ
- ๋ ผ๋ฌธ ์์ฝ, ์คํ ์ค๊ณ, ์ฝ๋ ์์ฑ๊น์ง ์๋ํ โ ํ์ต์๊ฐ ํ์๊ณผ ์ฐฝ์์ฑ์ ์ง์คํ ์ ์๋๋ก ์ง์
๐งโ๐ป ๊ฐ๋ฐ์ ์์ฐ์ฑ ํ์
- ๋ฐ๋ณต์ ์ด๊ณ ๋นํจ์จ์ ์ธ ์์ ์ CLI๊ฐ ๋์ฒด โ ๊ฐ๋ฐ์๋ ๋ก์ง ๋ฐ ์์ด๋์ด์ ์ง์ค
- ๊ฐ์ธ ๊ฐ๋ฐ์๊ฐ ํ ๋จ์์ ํ์ ์์ค๊น์ง ์์ฐ์ฑ์ ํฅ์ ๊ฐ๋ฅ
๐ฏ Codex CLI๋ ๋จ์ํ LLM ๊ธฐ๋ฐ ํฐ๋ฏธ๋ ๋๊ตฌ๋ฅผ ๋์ด, ์ฝ๋ ์์ฑยท์์ ยท๊ตฌํ ์ ์ฒด๋ฅผ ์๋ํํ๋ AI ๊ธฐ๋ฐ ์ด์์ฒด์ ์ ์ ์กฐ๋ก ์ดํด๋ ์ ์์ต๋๋ค.
โ๏ธ ๋ง๋ฌด๋ฆฌ ๋ฐ ์์ฌ์
o3 ๋ฐ o4-mini๋ ๋จ์ํ LLM์ด ์๋๋ผ ๋ฅ๋ํ AI ์์คํ ์ ๋ฐฉํฅ์ ์ ์ํฉ๋๋ค. ๋๊ตฌ์ ์ถ๋ก ์ ์ฐ๊ฒฐ์ ๋ฐํ์ผ๋ก, AI๋ ๋จ์ ๋ํ ํํธ๋๋ฅผ ๋์ด ์ง์ง ์์ ๋๋ฃ๊ฐ ๋์ด๊ฐ๊ณ ์์ต๋๋ค.
- Codex CLI์ ํจ๊ปํ๋ ์๋ก์ด ๋ฉํฐ๋ชจ๋ฌ ์ถ๋ก ๋ฐ ์ฑ ์์ฑ ํ๊ฒฝ์ ํนํ ๋ก์ปฌ ํ๊ฒฝ ์ค์ฌ์ ๊ฐ๋ฐ์๋ค์๊ฒ ์์ฐ์ฑ ํ์ ์ ์ ๊ณตํ๋ฉฐ, ํฅํ ๊ฐ์ธํ๋ AI ํ์ ๋๊ตฌ์ ๋ณธ๋ณด๊ธฐ๊ฐ ๋ ๊ฒ์ ๋๋ค.
์์ผ๋ก์ API ๊ฐ๋ฐฉ๊ณผ ์คํ์์ค ์ํ๊ณ ํ์ฅ์ AI์ ์ธ๊ฐ์ ํ์ ์๋๋ฅผ ๋ณธ๊ฒฉ์ ์ผ๋ก ์ด ๊ฒ์ด๋ฉฐ, ์ด ํ๋ฆ์ ์ค์ฌ์๋ o ์๋ฆฌ์ฆ๊ฐ ์์ ๊ฒ์ด๋ผ๊ณ ์๊ฐ๋ฉ๋๋ค.
์ฝ์ด์ฃผ์ ์ ๊ฐ์ฌํฉ๋๋ค!