OpenAI, ๋ ์์ฐ์ค๋ฝ๊ณ ์ง๋ฅ์ ์ธ ๋ํ ๋ฅ๋ ฅ์ ๊ฐ์ถ GPT-4.5 ์ถ์
์๋ณธ ๊ฒ์๊ธ: https://velog.io/@euisuk-chung/OpenAI-๋-์์ฐ์ค๋ฝ๊ณ -์ง๋ฅ์ ์ธ-๋ํ-๋ฅ๋ ฅ์-๊ฐ์ถ-GPT-4.5-์ถ์
์๋ ํ์ธ์! ๋ฏธ๊ตญ ๋ ์ง ๊ธฐ์ค(2025/02/27)์ OpenAI๊ฐ ์๋ก์ด AI ๋ชจ๋ธ GPT-4.5๋ฅผ ๋ฐํํ์ต๋๋ค.
-
GPT-4.5 ์๊ฐ
GPT-4.5
๋ ๊ธฐ์กด GPT-4o๋ณด๋ค ๋ ์์ฐ์ค๋ฝ๊ณ ์ง๋ฅ์ ์ธ ๋ํ ๋ฅ๋ ฅ์ ๊ฐ์ถ ๋ชจ๋ธ๋ก, Pro ์ฌ์ฉ์ ๋ฐ ๊ฐ๋ฐ์๋ฅผ ์ํ ์ฐ๊ตฌ ํ๋ฆฌ๋ทฐ(research preview) ํํ๋ก ์ ๊ณต๋ฉ๋๋ค.
์ถ์ฒ : Sam Altmanโs X post
-
GPT-4.5๋ ๋ค์๊ณผ ๊ฐ์ ์ฃผ์ ๊ฐ์ ์ฌํญ์ ํฌํจํฉ๋๋ค.
- ๋ ๋์ ํจํด ์ธ์ ๋ฐ ์ฐฝ์์ ํต์ฐฐ๋ ฅ ์ ๊ณต
- ์ฌ์ฉ์ ์๋๋ฅผ ๋์ฑ ์ ํํ๊ฒ ์ดํดํ๊ณ ๋์
- ๊ฐ์ฑ ์ง๋ฅ(EQ) ํฅ์์ผ๋ก ๋ณด๋ค ์ธ๊ฐ์ ์ธ ๋ํ ์ ๊ณต
- ํ๊ฐ(hallucination) ๊ฐ์๋ก ๋ ์ ๋ขฐํ ์ ์๋ ์ ๋ณด ์์ฑ
- ํ๋ก๊ทธ๋๋ฐ, ๊ธ์ฐ๊ธฐ, ๋ฌธ์ ํด๊ฒฐ ๋ฅ๋ ฅ ํฅ์
- ๋ ๋น ๋ฅธ ์๋ต ์๋ ๋ฐ ๊ฐ์ ๋ ๊ธฐ์ต๋ ฅ ์ ์ฉ
- ๋ํ ๋งฅ๋ฝ์ ๋์ฑ ๊น์ด ์๊ฒ ์ดํดํ๊ณ ์ฐ๊ฒฐ
-
๋ฐฐํฌ ์ผ์ ๋ฐ ๋์
๋ณธ ํจ๋ ํ ํฌ์์๋ GPT-4.5๊ฐ ์ฐ๊ตฌ ํ๋ฆฌ๋ทฐ(research preview)๋ก ์ถ์๋์์ผ๋ฉฐ, ChatGPT Pro ์ฌ์ฉ์ ๋ฐ API ๊ฐ๋ฐ์์๊ฒ ๋จผ์ ์ ๊ณต๋๋ค๊ณ ๋ฐํ์ต๋๋ค. (์ Sam Altman X post์์๋ ์ธ๊ธ๋ ๋ด์ฉ)
- ๊ทธ๋ฌ๋ ๋ค์ ์ฃผ๋ถํฐ Plus, Edu, Team ์ฌ์ฉ์์๊ฒ๋ ๋ฐฐํฌ๋๋ฉฐ, ์ดํ Enterprise ์ฌ์ฉ์์๊ฒ๊น์ง ํ๋๋ ์์ ์ด๋ผ๊ณ ํฉ๋๋ค.
-
GPT-4.5์ ๊ธฐ์ ์ ๋ฐ์
GPT-4.5๋ ๋น์ง๋ ํ์ต(unsupervised learning)์ ํ์ฅํ์ฌ ๋ ๊ฐ๋ ฅํ ๋ชจ๋ธ๋ก ๋ฐ์ ํ์ต๋๋ค.
- ํนํ GPT-4.5๋ ๋ ๋ง์ ๋ฐ์ดํฐ ์ธํธ์ ๊ณ ์ฑ๋ฅ ์ฐ์ฐ ๊ธฐ์ ์ ๊ฒฐํฉํ์ฌ ๋์ฑ ์ง๊ด์ ์ด๊ณ ์ ํํ ์๋ต์ ์ ๊ณตํฉ๋๋ค.
โ ๋น์ง๋ ํ์ต(unsupervised learning) ๊ฐํ
-
GPT-4.5๋ Microsoft Azure AI ์ํผ์ปดํจํฐ์์ ํ์ต๋์์ผ๋ฉฐ, ๋์ฑ ๋ฐฉ๋ํ ๋ฐ์ดํฐ์ ์ต์ ํ๋ ์ํคํ ์ฒ๋ฅผ ํ์ฉํ์ฌ ๋ ๋์ ์ง์๊ณผ ๊น์ ์ดํด๋ ฅ์ ํ๋ณดํ์ต๋๋ค.
- ์ด๋ฅผ ํตํด ํ๊ฐ์ ์ค์ด๊ณ , ์ฌ์ค ๊ธฐ๋ฐ์ ์ ๋ณด ์ ๊ณต ๋ฅ๋ ฅ์ด ํฅ์๋์์ต๋๋ค.
- ๊ธฐ์กด GPT-4o ๋๋น ์ธ์ด์ ์ ์ฐฝ์ฑ ์ฆ๊ฐ, ๋ค๊ตญ์ด ์ง์ ํฅ์, ์ค์๊ฐ ๊ฒ์ ๊ฒฐ๊ณผ ํตํฉ ๊ธฐ๋ฅ ๋ฑ์ ์ถ๊ฐ์ ์ธ ์ฅ์ ๋ ํฌํจ๋ฉ๋๋ค.
โก ์ง๊ด์ ๋ฌธ์ ํด๊ฒฐ(Intuitive Problem Solving) ๊ฐํ
-
GPT-4.5๋ ๋น์ง๋ ํ์ต์ ํ์ฅ์ ํตํด ๋์ฑ ์ง๊ด์ ์ธ ๋ฌธ์ ํด๊ฒฐ ๋ฅ๋ ฅ์ ๊ฐ์ถ๊ณ ์์ต๋๋ค.
- ์ด๋ ํนํ STEM(๊ณผํ, ๊ธฐ์ , ๊ณตํ, ์ํ) ๋ถ์ผ์์ ๋ณต์กํ ๋ฌธ์ ๋ฅผ ๋น ๋ฅด๊ฒ ์ดํดํ๊ณ , ํจํด์ ๊ธฐ๋ฐ์ผ๋ก ์ค์ฉ์ ์ธ ํด๊ฒฐ์ฑ ์ ์ ์ํ๋ ๋ฐ ๊ฐ์ ์ ๋ณด์ ๋๋ค.
- GPT-4.5๋ ๊ธฐ์กด์ ๋ ผ๋ฆฌ์ ์ถ๋ก ๋ชจ๋ธ๊ณผ ๋ฌ๋ฆฌ, ๋ฐ์ดํฐ๋ฅผ ํตํด ๋์ฑ ํ๋ถํ ์ง๊ด์ ํ์ตํ์ฌ ๋น ๋ฅด๊ณ ์ ๋ขฐ์ฑ ๋์ ์๋ต์ ์ ๊ณตํฉ๋๋ค.
- ๋ํ, ์ฝ๋ ์์ฑ ๋ฐ ์ต์ ํ, ์๊ณ ๋ฆฌ์ฆ ์ค๊ณ ๋ฑ์ ๋ถ์ผ์์๋ ํ์ธต ๋์ ์ฑ๋ฅ์ ๋ฐํํฉ๋๋ค.
- ํ์ง๋ง, ์ง๊ด์ ์ธ ๋ฌธ์ ์ ๊ฐํ๋ค๊ณ ํ๋๋ผ๋, ์๊ฐ์ ํด์ผํ๋ ๋ฌธ์ ๋ผ๋ฉด o1๋ณด๋ค ์ฑ๋ฅ์ด ์๋์จ๋ค๊ณ ํฉ๋๋ค.
-
GPT-4.5์ ๊ฐ์ฑ ์ง๋ฅ(EQ) ๋ฐ ์ง๊ด์ ๋ํ ๋ฅ๋ ฅ
- GPT-4.5๋ ๋ ์ธ๊ฐ์ ์ธ ๊ฐ์ฑ ์ง๋ฅ(EQ)์ ํตํด ๋ณด๋ค ์์ฐ์ค๋ฝ๊ณ ๊ณต๊ฐํ๋ ๋ํ๋ฅผ ์ ๊ณตํฉ๋๋ค.
-
์๋ก์ด ๊ฐ์ฑ ๋ถ์ ์๊ณ ๋ฆฌ์ฆ์ ์ ์ฉํ์ฌ ์ฌ์ฉ์ ๊ฐ์ ์ ๋ ์ ํํ ์ดํดํ๊ณ , ์ํฉ์ ๋ง๋ ์ ์ ํ ๋ฐ์์ ์ ๊ณตํฉ๋๋ค.
(๊ฐ์ธ์ ์ผ๋ก ๋ญ ์ด๋ป๊ฒ ๊ฐ์ฑ ๋ถ์ํ๋์ง ๊ถ๊ธํ๊ธดํ๋ฐ,,, ์ ๋ต์ ์๋ ค์ค์,,, ์ํธ๋ง ํ๋!!)
-
๐ GPT-4.5์ ๊ฐ์ฑ ์ง๋ฅ ๊ฐ์ ์ฌ๋ก
- GPT-4.5๋ ์ฌ์ฉ์์ ๊ฐ์ ์ ๋ ์ ์ดํดํ๊ณ , ๋ํ์ ๋งฅ๋ฝ์ ๊ณ ๋ คํ์ฌ ๋ ๋ฐ๋ปํ๊ณ ์์ฐ์ค๋ฌ์ด ๋ฐ์์ ์ ๊ณต
-
์์ : ์น๊ตฌ๊ฐ ์ฝ์์ ์ฌ๋ฌ ๋ฒ ์ทจ์ํ์ ๋ ๋ณด๋ผ ๋ฉ์์ง ์์ฑ ์์ฒญ
- GPT-4.5๋ ์ฌ์ฉ์๊ฐ ํ๊ฐ ๋ ๊ฐ์ ์ํ๋ผ๋ ์ ์ ์ธ์ํ๊ณ , ์ง์ ์ ์ธ ๋ถ๋ ธ ํํ ๋์ ๋ณด๋ค ๋ถ๋๋ฝ๊ณ ์์ฐ์ ์ธ ๋ฉ์์ง๋ฅผ ์ ์
- GPT-4o๋ ์ฌ์ฉ์์ ์์ฒญ์ ๊ทธ๋๋ก ์ํํ์ง๋ง, ๊ฐ์ ์ ์ธ ๋งฅ๋ฝ์ ์ดํดํ์ง ๋ชปํ๊ณ ์ง์ ์ ์ธ ๊ณต๊ฒฉ์ ์ธ ๋ฉ์์ง๋ฅผ ์ ๊ณต
- ๊ฐ์ฑ์ ๋์์ด ํ์ํ ์ํฉ์์ GPT-4.5๋ ๋ณด๋ค ์ธ๋ จ๋ ์๋ต์ ์์ฑํ๋ฉฐ, ์ฌ์ฉ์์์ ์ํธ์์ฉ์ ๋์ฑ ๊น์ด ์๋ ๊ฒฝํ์ผ๋ก ๋ง๋ค์ด ์ค
-
GPT-4.5์ ์์ฐ์ค๋ฌ์ด ๊ธ์ฐ๊ธฐ ๋ฐ ์ง์ ์ ๋ฌ ๋ฅ๋ ฅ
GPT-4.5๋ ๋ฌธ์ฅ์ ๋ช ํํ๊ณ ์ง๊ด์ ์ผ๋ก ์ ๋ฆฌํ์ฌ, ๋ ์๊ฐ ์ฝ๊ฒ ์ดํดํ ์ ์๋๋ก ๊ฐ์ ๋์์ต๋๋ค.
- ๋ํ, ๋ ์์ฐ์ค๋ฌ์ด ํ๋ฆ์ผ๋ก ์ ๋ณด๋ฅผ ์ ๋ฌํ๋ฉฐ, ์ด์ ๋ณด๋ค ํจ์ฌ ์ ์ฐฝํ ํํ์ ์์ฑํ ์ ์์ต๋๋ค.
-
์๋ ์ฌ๋ก๋ค์ ๋ณด๋ฉด ํ์คํ ์ข ๋ ๊น๋ํ ๋ต๋ณ๋ค์ด ๋์ค๋ ๊ฑฐ ๊ฐ๊ธดํ๋ค์ ๐
-
์ํ ๋งํด์ ์๋ก๊ฐ ํ์ํ ์ํฉ
-
์ฐ์ฃผ ํ์ฌ์ ๋ํด์ ์ด๋ป๊ฒ ์๊ฐํ๋์ง ๋ฌป๋ ์ํฉ
-
-
(์ฐธ๊ณ ) ๋ค์์ GPT์ ๋ฐ์ ์ ๋ฐ๋ผ์ ์ด๋ค ์์ผ๋ก ๋ต๋ณ์ด ๋์จ์ง ์ ๋ฆฌํ ๋ด์ฉ์ ๋๋ค.
-
ํ์ต ํ๊ฐ ๋ฐ ๋ชจ๋ธ ์ฑ๋ฅ ๋ถ์
GPT-4.5๋ ์ฌ๋ฌ ๋ถ์ผ์์ ๊ธฐ์กด ๋ชจ๋ธ๋ณด๋ค ๋ฐ์ด๋ ์ฑ๋ฅ์ ๋ณด์์ผ๋ฉฐ, ํนํ โ๋น์ง๋ ํ์ต ํ์ฅโ๋ง์ผ๋ก๋ ๋์ ์ฑ๋ฅ์ ๋ฌ์ฑํ์ต๋๋ค.
๐ ๋ฒค์น๋งํฌ ์ฑ๋ฅ ๋น๊ต
- OpenAI๋ GPT-4.5์ ์ฑ๋ฅ์ ๊ธฐ์กด ๋ชจ๋ธ๊ณผ ๋น๊ตํ๋ฉฐ ์ ํ์ฑ(accuracy) ์ฆ๊ฐ์ ํ๊ฐ๋ฅ ๊ฐ์๋ฅผ ์ ์ฆํ์ต๋๋ค.
(1) ์ฌ์ค ๊ธฐ๋ฐ ์ง๋ฌธ(SimpleQA) ์ฑ๋ฅ ๋น๊ต
๋ชจ๋ธ | ์ ํ๋(Accuracy) | ํ๊ฐ๋ฅ (Hallucination Rate) |
---|---|---|
GPT-4.5 | 62.5% | 37.1% |
GPT-4o | 38.2% | 61.8% |
OpenAI o1 | 47% | 44% |
OpenAI o3-mini | 15% | 80.3% |
โ GPT-4.5๋ ๊ธฐ์กด ๋ชจ๋ธ๋ณด๋ค ๋์ ์ ํ๋์ ๋ฎ์ ํ๊ฐ๋ฅ ์ ๋ณด์ฌ ์ ๋ขฐ์ฑ์ด ๋์์ก์ต๋๋ค.
(2) ์ธ๊ฐ ํ ์คํธ ๋น๊ต
์ฌ๋๋ค์๊ฒ ์ด๋ค ๋ชจ๋ธ์ ๋๋ต์ ๋ ์ ํธํ๋์ง ์ ํํ๋๋ก ํ์ต๋๋ค.
ํ๊ฐ ํญ๋ชฉ | GPT-4.5 ์ ํธ์จ(GPT-4o ๋๋น) |
---|---|
์ผ์ ์ง๋ฌธ | 57.0% |
์ ๋ฌธ์ ์ธ ์ง๋ฌธ | 63.2% |
์ฐฝ์์ ์ธ ์์ | 56.8% |
โ ์ด๋ GPT-4.5๊ฐ ์์ฐ์ค๋ฌ์ด ๋ํ, ๊ฐ์ฑ์ ์ดํด๋ ฅ, ๋ ผ๋ฆฌ์ ์ถ๋ก ๋ฅ๋ ฅ์์ ๋ ์ฐ์ํจ์ ์๋ฏธํฉ๋๋ค.
(3) ์ฑ๋ฅ ํ์ธ์ฉ ๋ฒค์น๋งํฌ ๋ฐ์ดํฐ์ ๋น๊ต
์ ๋ฐ์ ์ผ๋ก ์ค์ํ ์ฑ๋ฅ์ ๋ด๋ ๊ฒ์ ํ์ธํ ์ ์์
์๋ ๊ณผํ/์ํ์ ๊ฒฝ์ฐ ์๊ฐ์ ํ์๋ก ํ๊ธฐ๋๋ฌธ์ 4.5๊ฐ o3-mini๋ณด๋ค ์ฑ๋ฅ์ด ๋ฎ์
-
๊ณผํ ํ๊ฐ(GPQA):
- GPT-4.5: 71.4%
- GPT-4o: 53.6%
- OpenAI o3-mini: 79.7% (์ถ๋ก ๋ชจ๋ธ์ด๋ฏ๋ก ์๋์ ์ผ๋ก ์ฐ์)
-
์ํ ํ๊ฐ(AIME 2024):
- GPT-4.5: 36.7%
- GPT-4o: 9.3%
- OpenAI o3-mini: 87.3% (์ถ๋ก ๋ชจ๋ธ์ด๋ฏ๋ก ์๋์ ์ผ๋ก ์ฐ์)
๐ GPT-4.5๋ ๋ ผ๋ฆฌ์ ์ถ๋ก ์ด ํ์ํ ํ๊ฐ์์๋ ์ถ๋ก ๋ชจ๋ธ(OpenAI o3-mini)๋ณด๋ค ๋ฎ์ ์ฑ๋ฅ์ ๋ณด์.
- ํ์ง๋ง, ์ง๊ด์ ์ง์ ๋ฐ ๋ค๊ตญ์ด ์ดํด๋ ฅ์์๋ ๋งค์ฐ ๋ฐ์ด๋ ์ฑ๋ฅ์ ๋ณด์.
-
GPT-4.5์ ํ์ฉ ์ฌ๋ก
๐ค๐ญ ๊ทธ๋ ๋ค๋ฉด GPT4.5๋ ์ด๋ป๊ฒ ์ฐ์ด๋ฉด ์ข์๊น?
GPT-4.5๋ ๋ค์ํ ๋ถ์ผ์์ ์ ์ฉํ๊ฒ ํ์ฉ๋ ์ ์์ต๋๋ค.
(1) ๊ฐ์ฑ์ ์ง์ ๋ฐ ๋ํ
- ์ด๋ ค์ด ์๊ธฐ์ ๊ณต๊ฐํ๋ ๋ํ ์ ๊ณต
- ๊ฐ์ธ์ ๊ฐ์ ์ ์ดํดํ๊ณ ์๋กํ๋ AI ์ญํ ์ํ
(2) ์ ๋ณด ๊ฒ์ ๋ฐ ์ง์ ์ ๊ณต
- ๋ณต์กํ ์ง๋ฌธ์ ๋ํ ์ ํํ๊ณ ์ ๋ขฐํ ์ ์๋ ๋ต๋ณ ์ ๊ณต
- ์ญ์ฌ, ๊ณผํ, ์์ , ๊ธฐ์ ๋ฑ ๋ค์ํ ๋ถ์ผ์ ๊ฑธ์ณ ๊น์ด ์๋ ์ค๋ช
(3) ์ฐฝ์์ ์ธ ์์ ์ง์
- ๊ธ์ฐ๊ธฐ, ๋์์ธ, ์์ ์ ์๊ฐ์ ์ํ ๋๊ตฌ๋ก ํ์ฉ
- ์ฝ๋ ์์ฑ ๋ฐ ์ต์ ํ ์ง์
-
๊ฒฐ๋ก
GPT-4.5๋ ๋น์ง๋ ํ์ต ํ์ฅ, ๊ฐ์ฑ ์ง๋ฅ ๊ฐํ, ์ ํ์ฑ ์ฆ๊ฐ ๋ฑ ์ฌ๋ฌ ๋ฐฉ๋ฉด์์ ๊ฐ์ ๋ AI ๋ชจ๋ธ์ ๋๋ค.
ํนํ, ๋ ์ ๋ขฐํ ์ ์๊ณ ์์ฐ์ค๋ฌ์ด ๋ํ ๋ฅ๋ ฅ์ ๊ฐ์ถ์์ผ๋ฉฐ, ์ฐฝ์์ ์ธ ์์ ๋ฐ ๋ฌธ์ ํด๊ฒฐ์์ ๊ฐ๋ ฅํ ์ฑ๋ฅ์ ๋ฐํํฉ๋๋ค.
OpenAI๋ ํฅํ GPT-4.5์ ์ฑ๋ฅ์ ์ง์์ ์ผ๋ก ํ๊ฐํ๋ฉฐ, ์ฌ์ฉ์ ํผ๋๋ฐฑ์ ๋ฐํ์ผ๋ก ๊ฐ์ ์ ์ด์ด๊ฐ ์์ ์ ๋๋ค.
AI ๊ธฐ์ ์ด ๋์ฑ ๋ฐ์ ํ๋ฉด์ GPT-4.5๋ ์ธ๊ฐ๊ณผ ๋์ฑ ์์ฐ์ค๋ฝ๊ฒ ํ๋ ฅํ ์ ์๋ ๊ฐ๋ ฅํ ๋๊ตฌ๋ก ์๋ฆฌ ์ก์ ๊ฒ์ ๋๋ค.
๋นจ๋ฆฌ ๋ค์ ์ฃผ์ Plus ์ ์ ๋ค์๊ฒ๋ ํ๋ ค์ ์ฌ์ฉํด๋ณผ ์ ์์ผ๋ฉด ์ข๊ฒ ์ต๋๋ค! ๐
์ฝ์ด์ฃผ์ ์ ๊ฐ์ฌํฉ๋๋ค ๐