NVIDIA GTC 2026 ํค๋ ธํธ ์๋ฒฝ ์ ๋ฆฌ: Inference Inflection๋ถํฐ Physical AI๊น์ง

2025๋ 3์ 17์ผ, NVIDIA์ CEO Jensen Huang์ด GTC 2026 ํค๋ ธํธ๋ฅผ ํตํด AI ์ฐ์ ์ ํ์ฌ์ ๋ฏธ๋๋ฅผ ์กฐ๋งํ์ต๋๋ค. 450๊ฐ ๊ธฐ์ ์ด ์คํฐ์๋ก ์ฐธ์ฌํ๊ณ , 1,000๊ฐ์ ๊ธฐ์ ์ธ์ ๊ณผ 20,000๋ช ์ ์ฐ์ฌ๊ฐ ํจ๊ปํ ์ด๋ฒ GTC๋ AI ์ธํ๋ผ์ 5๊ฐ ๋ ์ด์ด(ํ ์ง/์ ๋ ฅ/์ ธ โ ์ธํ๋ผ โ ์นฉ โ ํ๋ซํผ/๋ชจ๋ธ โ ์ ํ๋ฆฌ์ผ์ด์ )๋ฅผ ๋ชจ๋ ์์ฐ๋ฅด๋ ์ญ๋ ์ต๋ ๊ท๋ชจ์ ํ์ฌ์์ต๋๋ค.
์ด ๊ธ์์๋ ํค๋ ธํธ ๋ฐํ ์์๋ฅผ ๊ทธ๋๋ก ๋ฐ๋ผ๊ฐ๋ฉฐ, ํต์ฌ ๋ด์ฉ์ ๋น ์ง์์ด ์ ๋ฆฌํฉ๋๋ค.
-
CUDA์ 20๋ , ๊ทธ๋ฆฌ๊ณ Flywheel ํจ๊ณผ
Jensen์ ํค๋ ธํธ์ ์์์ CUDA์ 20์ฃผ๋ ๊ธฐ๋ ์ผ๋ก ์ด์์ต๋๋ค. CUDA๋ SIMT(Single Instruction Multi-Threaded) ์ํคํ ์ฒ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก, Scalar ์ฝ๋๋ฅผ ๋ฉํฐ์ค๋ ๋ ์ ํ๋ฆฌ์ผ์ด์ ์ผ๋ก ์ฝ๊ฒ ๋ณํํ ์ ์๊ฒ ์ค๊ณ๋ ํ๋ช ์ ์ธ ๋ฐ๋ช ์ ๋๋ค. ์ต๊ทผ์๋ Tensor Core ํ๋ก๊ทธ๋๋ฐ์ ๋๊ธฐ ์ํ Tile ๊ธฐ๋ฅ์ด ์ถ๊ฐ๋์๊ณ , ์์ฒ ๊ฐ์ ๋๊ตฌ, ์ปดํ์ผ๋ฌ, ํ๋ ์์ํฌ, ๋ผ์ด๋ธ๋ฌ๋ฆฌ๊ฐ ์คํ์์ค๋ก ์ ๊ณต๋๊ณ ์์ต๋๋ค.
Jensen์ NVIDIA ์ ๋ต์ ํต์ฌ์ ํ๋์ ์ฐจํธ๋ก ์ค๋ช ํ์ต๋๋ค. ๋ฐ๋ก Flywheel(ํ๋ผ์ดํ ) ๋ชจ๋ธ์ ๋๋ค.
- Installed Base(์ค์น ๊ธฐ๋ฐ): 20๋ ์ ๊ฑธ์ณ ์ ์ธ๊ณ ์์ต ๋์ GPU์ ์ปดํจํ ์์คํ ์ CUDA๊ฐ ์ค์น๋์์ต๋๋ค. ๋ชจ๋ ํด๋ผ์ฐ๋, ๋ชจ๋ ์ปดํจํฐ ํ์ฌ์ NVIDIA๊ฐ ์กด์ฌํฉ๋๋ค.
- ๊ฐ๋ฐ์ ์ ์ : ์ค์น ๊ธฐ๋ฐ์ด ๊ฐ๋ฐ์๋ฅผ ๋์ด๋ค์ด๊ณ , ๊ฐ๋ฐ์๊ฐ ์๋ก์ด ์๊ณ ๋ฆฌ์ฆ์ ๋ง๋ค์ด Deep Learning ๊ฐ์ ๋ธ๋ ์ดํฌ์ค๋ฃจ๋ฅผ ๋ฌ์ฑํฉ๋๋ค.
- ์๋ก์ด ์์ฅ ์ฐฝ์ถ: ๋ธ๋ ์ดํฌ์ค๋ฃจ๊ฐ ์ ์์ฅ์ ๋ง๋ค๊ณ , ์ ์์ฅ์ด ์ ์ํ๊ณ๋ฅผ ๊ตฌ์ถํ๋ฉฐ, ๋ ํฐ ์ค์น ๊ธฐ๋ฐ์ผ๋ก ์ด์ด์ง๋๋ค.
์ด Flywheel์ด ๊ฐ์๋๊ณ ์์ผ๋ฉฐ, NVIDIA ๋ผ์ด๋ธ๋ฌ๋ฆฌ ๋ค์ด๋ก๋ ์๊ฐ ๋๊ท๋ชจ์์๋ ๊ณผ๊ฑฐ ์ด๋ ๋๋ณด๋ค ๋น ๋ฅด๊ฒ ์ฑ์ฅํ๊ณ ์๋ค๊ณ ๊ฐ์กฐํ์ต๋๋ค. ๋ํ Ampere GPU๊ฐ 6๋ ์ ์ถํ๋์์์๋ ํด๋ผ์ฐ๋์์์ ๊ฐ๊ฒฉ์ด ์คํ๋ ค ์์นํ๊ณ ์๋๋ฐ, ์ด๋ CUDA ํ๋ซํผ ์์์ ์คํ ๊ฐ๋ฅํ ์ ํ๋ฆฌ์ผ์ด์ ์ด ๋๋ฌด๋ ๋ค์ํ๊ธฐ ๋๋ฌธ์ GPU์ ์ ํจ ์๋ช (Useful Life)์ด ๊ทน๋๋ก ๊ธธ๊ธฐ ๋๋ฌธ์ด๋ผ๊ณ ์ค๋ช ํ์ต๋๋ค.
ํต์ฌ ๋ฉ์์ง๋ ๋ช ํํฉ๋๋ค. NVIDIA๋ ์ํํธ์จ์ด๋ฅผ ์ง์์ ์ผ๋ก ์ ๋ฐ์ดํธํจ์ผ๋ก์จ, ๋์ผํ ํ๋์จ์ด์์ ์ต์ด ๋์ ์์ ์ฑ๋ฅ ํฅ์(First-time Pop) ๋ฟ ์๋๋ผ ์๊ฐ์ ๋ฐ๋ฅธ ์ง์์ ๋น์ฉ ์ ๊ฐ๊น์ง ์ ๊ณตํ๋ค๋ ๊ฒ์ ๋๋ค.
-
GeForce์์ Neural Rendering๊น์ง: 25๋ ์ ๊ทธ๋ํฝ์ค ์ฌ์
Jensen์ CUDA์ ๊ธฐ์์ 25๋ ์ GeForce๊น์ง ๊ฑฐ์ฌ๋ฌ ์ฌ๋ผ๊ฐ์ต๋๋ค.
- 25๋ ์ : Programmable Shader ๋ฐ๋ช . ์ธ๊ณ ์ต์ด์ ํ๋ก๊ทธ๋๋จธ๋ธ ๊ฐ์๊ธฐ์ธ Pixel Shader๊ฐ ํ์ํ์ต๋๋ค.
- 20๋ ์ : CUDA ๋ฐ๋ช . GeForce ์์ CUDA๋ฅผ ์ฌ๋ ค ๋ชจ๋ ์ปดํจํฐ์ ๋ฐฐํฌํ๊ฒ ๋ค๋ ๊ฒฐ์ ์ ๋น์ ํ์ฌ ์ด์ต์ ๋๋ถ๋ถ์ ์๋ชจํ๋ ๊ฑฐ๋ํ ํฌ์์์ต๋๋ค.
- GeForce๊ฐ AI๋ฅผ ์ธ์์ ๊ฐ์ ธ์ด: GeForce ๋๋ถ์ Alex Krizhevsky, Ilya Sutskever, Geoffrey Hinton, Andrew Ng ๋ฑ์ด GPU๋ก Deep Learning์ ๊ฐ์ํ ์ ์์์ต๋๋ค.
- 8๋ ์ : RTX ์ํคํ ์ฒ ๋์ . Hardware Ray Tracing๊ณผ AI๋ฅผ ๊ฒฐํฉํ ์๋ก์ด ๊ทธ๋ํฝ์ค ํจ๋ฌ๋ค์์ด ์์๋์์ต๋๋ค.
๊ทธ๋ฆฌ๊ณ ํค๋ ธํธ์์ ์ฐจ์ธ๋ ๊ทธ๋ํฝ์ค ๊ธฐ์ ์ธ Neural Rendering๊ณผ DLSS 5๊ฐ ๊ณต๊ฐ๋์์ต๋๋ค. ์ด๋ 3D ๊ทธ๋ํฝ์ค์ AI๋ฅผ ์ตํฉํ ๊ฒ์ผ๋ก, ์ ์ด ๊ฐ๋ฅํ(Controllable) 3D ๊ทธ๋ํฝ์ค์ Structured Data์ Generative AI์ Probabilistic Computing์ ๊ฒฐํฉํฉ๋๋ค. ํ๋๋ ์์ ํ ์์ธก ๊ฐ๋ฅํ๊ณ , ๋ค๋ฅธ ํ๋๋ ํ๋ฅ ์ ์ด์ง๋ง ๋งค์ฐ ์ฌ์ค์ ์ธ๋ฐ, ์ด ๋์ ๊ฒฐํฉํ์ฌ ์๋ฆ๋ต๊ณ ์ ์ด ๊ฐ๋ฅํ ์ฝํ ์ธ ๋ฅผ ์์ฑํฉ๋๋ค.
Jensen์ ์ด โStructured Data + Generative AIโ ์ตํฉ ์ปจ์ ์ด ์ฐ์ ์ ๋ฐ์ ๊ฑธ์ณ ๋ฐ๋ณต๋ ๊ฒ์ด๋ผ๊ณ ๊ฐ์กฐํ์ต๋๋ค.
-
๋ฐ์ดํฐ ์ฒ๋ฆฌ์ ํ์ : cuDF, cuVS, ๊ทธ๋ฆฌ๊ณ ํด๋ผ์ฐ๋ ํํธ๋์ญ
3.1 Structured Data์ Unstructured Data
Jensen์ ๋ฐ์ดํฐ ์ฒ๋ฆฌ์ ๋ ์ถ์ ์ ์ํ์ต๋๋ค.
Structured Data๋ SQL, Spark, pandas, Polars ๋ฑ์ผ๋ก ์ฒ๋ฆฌ๋๋ ๋ฐ์ดํฐํ๋ ์ ๊ธฐ๋ฐ์ โ๋น์ฆ๋์ค์ Ground Truthโ์ ๋๋ค. Snowflake, Databricks, Amazon EMR, Azure Fabric, Google BigQuery ๊ฐ์ ํ๋ซํผ๋ค์ด ์ด๋ฅผ ๋ค๋ฃจ๊ณ ์์ต๋๋ค. ๋ฏธ๋์๋ AI Agent๊ฐ ์ด Structured Database๋ฅผ ์ง์ ์ฌ์ฉํ๊ฒ ๋๋ฏ๋ก, ๋ฐ์ดํฐ ์ฒ๋ฆฌ ์๋๋ฅผ ๊ทน์ ์ผ๋ก ๋์ฌ์ผ ํฉ๋๋ค.
Unstructured Data๋ PDF, ์์, ์์ฑ ๋ฑ ์ ์ธ๊ณ ์์ฑ ๋ฐ์ดํฐ์ ์ฝ 90%๋ฅผ ์ฐจ์งํ์ง๋ง, ์ง๊ธ๊น์ง๋ ์ธ๋ฑ์ฑ์ด ๋ถ๊ฐ๋ฅํด ์ฌ์ค์ ํ์ฉ์ด ๋ถ๊ฐ๋ฅํ์ต๋๋ค. ์ด์ Multimodality Perception & Understanding์ ํ์ฉํ AI๊ฐ ์ด ๋ฐ์ดํฐ์ ์๋ฏธ๋ฅผ ์ดํดํ๊ณ , ๊ฒ์ ๊ฐ๋ฅํ ๊ตฌ์กฐ๋ก ์๋ฒ ๋ฉํฉ๋๋ค.
NVIDIA๋ ์ด ๋ ๊ฐ์ง๋ฅผ ์ํด ํต์ฌ ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ฅผ ๋ง๋ค์์ต๋๋ค.
- cuDF: Structured Data(๋ฐ์ดํฐํ๋ ์) ๊ฐ์ ๋ผ์ด๋ธ๋ฌ๋ฆฌ
- cuVS: Vector Store ๊ฐ์ ๋ผ์ด๋ธ๋ฌ๋ฆฌ (Semantic/Unstructured Data)
3.2 ์ฃผ์ ํํธ๋์ญ ๋ฐํ
- IBM: SQL์ ๋ฐ๋ช ์ฌ์ธ IBM์ด WatsonX Data์ ์ํ ์์ง์ cuDF๋ก ๊ฐ์ํฉ๋๋ค. ์ฌ๋ก๋ก Nestlรฉ๋ 185๊ฐ๊ตญ์ ๊ณต๊ธ๋ง ๋ฐ์ดํฐ๋ฅผ GPU ๊ฐ์ WatsonX Data๋ก ์ฒ๋ฆฌํ์ฌ, CPU ๋๋น 5๋ฐฐ ๋น ๋ฅด๊ณ 83% ๋ฎ์ ๋น์ฉ์ ๋ฌ์ฑํ์ต๋๋ค.
- Dell: Dell AI Data Platform์ cuDF์ cuVS๋ฅผ ํตํฉํ์ฌ On-Prem ํ๊ฒฝ์ AI ๋ฐ์ดํฐ ํ๋ซํผ์ ๊ตฌ์ถํ์ต๋๋ค. NTT Data์์ ํ์ ์์ ํฐ ์๋ ํฅ์์ ๋ณด์ฌ์ฃผ์์ต๋๋ค.
- Google Cloud: BigQuery ๊ฐ์์ ํตํด Snapchat์ ์ปดํจํ ๋น์ฉ์ ์ฝ 80% ์ ๊ฐํ์ต๋๋ค.
3.3 ํด๋ผ์ฐ๋ ์๋น์ค ํํธ๋ ์ํ๊ณ
Jensen์ NVIDIA์ ์ฃผ์ ํด๋ผ์ฐ๋ ์๋น์ค ์ ๊ณต์(CSP)๋ค์ ๊ด๊ณ๋ฅผ ์์ธํ ์ค๋ช ํ์ต๋๋ค.
- Google Cloud: Vertex AI, BigQuery ๊ฐ์. JAX/XLA์ PyTorch ๋ชจ๋์์ ๋ฐ์ด๋ ์ฑ๋ฅ. Base Ten, CrowdStrike, PUMA, Salesforce ๋ฑ์ด ๊ณ ๊ฐ์ผ๋ก ํ๋ํฉ๋๋ค.
- AWS: EMR, SageMaker, Bedrock ๊ฐ์. OpenAI๋ฅผ AWS์ ๊ฐ์ ธ์ค๋ ์๋ก์ด ํํธ๋์ญ์ ๋ฐํํ์ต๋๋ค.
- Microsoft Azure: NVIDIA์ ์ฒซ A100 ์ํผ์ปดํจํฐ๊ฐ Azure์ ์ค์น๋์๊ณ , ์ด๊ฒ์ด OpenAI์์ ํํธ๋์ญ์ผ๋ก ์ด์ด์ก์ต๋๋ค. Azure Cloud, AI Foundry, Bing Search ๊ฐ์. ๊ธฐ๋ฐ ์ปดํจํ (Confidential Computing)์ ํตํด OpenAI์ Anthropic ๋ชจ๋ธ์ ์์ ํ ๋ฐฐํฌ๋ฅผ ์ง์ํฉ๋๋ค.
- Oracle: NVIDIA๋ Oracle์ ์ฒซ AI ๊ณ ๊ฐ์ด์ ์ฒซ ๊ณต๊ธ์ ์ฒด์์ต๋๋ค. OpenAI, Cohere, Fireworks ๋ฑ์ด Oracle Cloud์์ ํ๋ํฉ๋๋ค.
- CoreWeave: ์ธ๊ณ ์ต์ด์ AI Native Cloud๋ก, GPU ํธ์คํ ๋ง์ ์ํด ์ค๊ณ๋ ํ์ฌ์ ๋๋ค.
- Palantir + Dell: 3์ฌ๊ฐ ํ๋ ฅํ์ฌ ์์ด๊ฐญ(Air-gapped) ํ๊ฒฝ, ์จํ๋ ๋ฏธ์ค, ํ์ฅ ์ด๋์๋ ๋ฐฐํฌ ๊ฐ๋ฅํ AI ํ๋ซํผ์ ๊ตฌ์ถํ์ต๋๋ค.
-
Vertically Integrated, Horizontally Open
Jensen์ NVIDIA์ ์ ์ฒด์ฑ์ โ์์ง์ ์ผ๋ก ํตํฉ๋์์ง๋ง, ์ํ์ ์ผ๋ก ๊ฐ๋ฐฉ๋โ ํ์ฌ๋ผ๊ณ ์ ์ํ์ต๋๋ค.
Accelerated Computing์ ํต์ฌ์ โApplication Accelerationโ์ ๋๋ค. CPU๊ฐ ๋ชจ๋ ๊ฒ์ ๋ฒ์ฉ์ผ๋ก ๋น ๋ฅด๊ฒ ํ๋ ์๋(Mooreโs Law)๊ฐ ๋๋ฌ๊ธฐ ๋๋ฌธ์, ์ด์ ๋ ๋๋ฉ์ธ๋ณ ๊ฐ์(Domain-Specific Acceleration)๋ง์ด ํฐ ์ฑ๋ฅ ํฅ์๊ณผ ๋น์ฉ ์ ๊ฐ์ ๊ฐ์ ธ์ฌ ์ ์์ต๋๋ค. ์ด๊ฒ์ด NVIDIA๊ฐ ๋ผ์ด๋ธ๋ฌ๋ฆฌ-๋๋ฉ์ธ-๋ฒํฐ์ปฌ๋ณ๋ก ํ์ฅํด์ผ ํ๋ ์ด์ ์ ๋๋ค.
NVIDIA๋ ์ ํ๋ฆฌ์ผ์ด์ ๊ณผ ๋๋ฉ์ธ์ ์๊ณ ๋ฆฌ์ฆ์ ์ดํดํ๊ณ , ๋ฐ์ดํฐ์ผํฐ/ํด๋ผ์ฐ๋/์จํ๋ ๋ฏธ์ค/์ฃ์ง/๋ก๋ณดํฑ์ค ๋ฑ ๋ค์ํ ๋ฐฐํฌ ํ๊ฒฝ์ ๋ง๊ฒ ์ต์ ํํฉ๋๋ค. ๋์์, ์ด ๊ธฐ์ ์ ์ธ๊ณ์ ๋ชจ๋ ํ๋ซํผ์ ํตํฉํ์ฌ ๊ฐ๋ฐฉํฉ๋๋ค.
-
์ฐ์ ๋ณ ์ํฅ๋ ฅ๊ณผ AI Native ๊ธฐ์ ์ ๋ถ์
5.1 ๋ฒํฐ์ปฌ ์ฐ์
GTC 2026์์ NVIDIA๊ฐ ๋ค๋ฃจ๋ ์ฃผ์ ์ฐ์ ๋ฒํฐ์ปฌ์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
- ์์จ์ฃผํ: ๊ด๋ฒ์ํ ๋๋ฌ ๋ฒ์์ ์ํฅ๋ ฅ
- ๊ธ์ต ์๋น์ค: GTC ์ต๋ ์ฐธ์์ ๋น์ค. ํํธ ๊ธฐ๋ฐ ๊ณ ์ ์ ML์์ Transformer ๊ธฐ๋ฐ ๋ฅ๋ฌ๋/LLM์ผ๋ก ์ ํ ์ค
- ํฌ์ค์ผ์ด: Drug Discovery๋ฅผ ์ํ AI Biology, ์ง๋จ์ฉ AI Agent, Physical AI ๋ก๋ด ์์คํ
- ์ฐ์ : AI Factory, ์นฉ ๊ณต์ฅ, ์ปดํจํฐ ๊ณต์ฅ ๋ฑ ์ญ์ฌ์ ์ต๋ ๊ท๋ชจ์ ๊ฑด์ค
- ๋ฏธ๋์ด/์ํฐํ ์ธ๋จผํธ/๊ฒ์: ์ค์๊ฐ AI ํ๋ซํผ, ๋ฒ์ญ, ๋ฐฉ์ก
- ์์ ์ปดํจํ : 35๊ฐ ๊ธฐ์ ์ด ์ฐจ์ธ๋ Quantum-GPU ํ์ด๋ธ๋ฆฌ๋ ์์คํ ๊ฐ๋ฐ ์ค
- ๋ฆฌํ ์ผ/CPG: ๊ณต๊ธ๋ง ์ต์ ํ, Agentic ์ผํ ์์คํ ($35T ์ฐ์ )
- ๋ก๋ณดํฑ์ค: ์ ์กฐ์ $50T ์ฐ์ , NVIDIA๋ 10๋ ๊ฐ ๋ก๋ด์ ์ํ 3๋ ์ปดํจํฐ(Training, Synthetic Data, Robot ๋ด์ฅ)๋ฅผ ๊ฐ๋ฐ
- ํต์ : $2T ์ฐ์ . ๊ธฐ์ง๊ตญ์ด AI ์ธํ๋ผ ํ๋ซํผ(AI RAN)์ผ๋ก ๋ณํ. Nokia, T-Mobile ๋ฑ๊ณผ ํ๋ ฅ
5.2 CUDA X ๋ผ์ด๋ธ๋ฌ๋ฆฌ
NVIDIA์ โCrown Jewelsโ๋ CUDA X ๋ผ์ด๋ธ๋ฌ๋ฆฌ์ ๋๋ค. ์ด๋ฒ GTC์์ ์ฝ 100๊ฐ์ ๋ผ์ด๋ธ๋ฌ๋ฆฌ์ 40๊ฐ์ ๋ชจ๋ธ์ ๋ฐํํ์ต๋๋ค. ๋ํ์ ์ธ ๊ฒ๋ค์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
- cuDNN: Deep Neural Network ๋ผ์ด๋ธ๋ฌ๋ฆฌ. ํ๋ AI ๋น ๋ฑ ์ ์๋๋ ฅ
- cuOpt: ์์ฌ๊ฒฐ์ ์ต์ ํ
- cuLitho: Computational Lithography
- cuDSS: Direct Sparse Solver
- Aerial: AI RAN
- Warp: Differentiable Physics
- Parabricks: Genomics
Jensen์ NVIDIA๋ฅผ โ์๊ณ ๋ฆฌ์ฆ ํ์ฌโ๋ผ๊ณ ํํํ๋ฉฐ, ์ด๋ฌํ ๋๋ฉ์ธ๋ณ ๋ผ์ด๋ธ๋ฌ๋ฆฌ๊ฐ ์ปดํจํ ํ๋ซํผ์ ํ์ฑํํ์ฌ ์ค์ ๋ฌธ์ ํด๊ฒฐ์ ์ฐ๊ฒฐํ๋ ํต์ฌ์ด๋ผ๊ณ ๊ฐ์กฐํ์ต๋๋ค.
5.3 AI Native ๊ธฐ์ ์ ํญ๋ฐ์ ์ฑ์ฅ
์ง๋ 2๋ ๊ฐ AI Native ๊ธฐ์ ์ ๋ํ ๋ฒค์ฒ ํฌ์๊ฐ $150B(์ญ์ฌ์ ์ต๋)์ ๋ฌํ์ต๋๋ค. ํฌ์ ๊ท๋ชจ๋ ์๋ฐฑ๋ง ๋ฌ๋ฌ์์ ์์ต~์์ญ์ต ๋ฌ๋ฌ๋ก ๊ธ์ฆํ์ต๋๋ค. OpenAI, Anthropic์ ๋น๋กฏํ ์๋ง์ AI Native ๊ธฐ์ ๋ค์ด ํ์ํ๊ณ , PC ํ๋ช , ์ธํฐ๋ท ํ๋ช , ๋ชจ๋ฐ์ผ/ํด๋ผ์ฐ๋ ํ๋ช ์ ์ด์ ์๋ก์ด ํ๋ซํผ ์ ํ๊ธฐ์ ์์์ ์๋ฆฌ๊ณ ์์ต๋๋ค.
-
AI์ 3๋ Inflection๊ณผ Inference Inflection์ ๋๋
Jensen์ ์ง๋ 2๋ ๊ฐ AI์์ ์ผ์ด๋ ์ธ ๊ฐ์ง ๊ฒฐ์ ์ ์ ํ์ ์ ์ค๋ช ํ์ต๋๋ค.
์ฒซ ๋ฒ์งธ, Generative AI (ChatGPT, 2022-2023). AI๊ฐ ์ธ์(Perceive)๊ณผ ์ดํด(Understand)๋ฅผ ๋์ด, ๊ณ ์ ํ ์ฝํ ์ธ ๋ฅผ ์์ฑ(Generate)ํ ์ ์๊ฒ ๋์์ต๋๋ค. ์ปดํจํ ํจ๋ฌ๋ค์ ์์ฒด๊ฐ Retrieval ๊ธฐ๋ฐ์์ Generative ๊ธฐ๋ฐ์ผ๋ก ์ ํ๋์์ต๋๋ค.
๋ ๋ฒ์งธ, Reasoning AI (O1, 2023-2024). AI๊ฐ ์ค์ค๋ก ๋ฐ์ฑ(Reflect)ํ๊ณ , ์ฌ๊ณ (Think)ํ๊ณ , ๊ณํ(Plan)ํ๊ณ , ๋ฌธ์ ๋ฅผ ๋ถํด(Decompose)ํ ์ ์๊ฒ ๋์์ต๋๋ค. O1์ Generative AI๋ฅผ ์ ๋ขฐํ ์ ์๊ณ ์ฌ์ค์ ๊ธฐ๋ฐํ(Grounded on Truth) ๊ฒ์ผ๋ก ๋ง๋ค์์ต๋๋ค. ์ด๋ก ์ธํด Input/Output Token ์ฌ์ฉ๋์ด ํฌ๊ฒ ์ฆ๊ฐํ์ต๋๋ค.
์ธ ๋ฒ์งธ, Agentic AI (Claude Code, 2024-2025). ์ต์ด์ Agentic ๋ชจ๋ธ๋ก, ํ์ผ ์ฝ๊ธฐ, ์ฝ๋ฉ, ์ปดํ์ผ, ํ ์คํธ, ํ๊ฐ, ๋ฐ๋ณต์ ์์จ์ ์ผ๋ก ์ํํฉ๋๋ค. NVIDIA ์ ์ฌ์ ์ผ๋ก 100%์ ์ํํธ์จ์ด ์์ง๋์ด๊ฐ Claude Code, Codex, Cursor ์ค ํ๋ ์ด์์ ์ฌ์ฉํ๊ณ ์์ต๋๋ค. AI์๊ฒ โ๋ฌด์์ด, ์ด๋์, ์ธ์ , ์ด๋ป๊ฒโ๋ฅผ ๋ฌป๋ ๊ฒ์ด ์๋๋ผ โ๋ง๋ค์ด๋ผ, ํด๋ผ, ๊ตฌ์ถํ๋ผโ๊ณ ์ง์ํ๋ ์๋๊ฐ ์ด๋ ธ์ต๋๋ค.
์ด ์ธ ๊ฐ์ง ์ ํ์ ๊ฒฐ๊ณผ๋ก, ์ง๋ 2๋ ๊ฐ AI ์ปดํจํ ์์๊ฐ ์ฝ 100๋ง ๋ฐฐ ์ฆ๊ฐํ์ต๋๋ค. ์์ ๋น ํ์ํ ์ฐ์ฐ๋์ด ์ฝ 10,000๋ฐฐ, ์ฌ์ฉ๋์ด ์ฝ 100๋ฐฐ ์ฆ๊ฐํ ๊ฒ์ ๋๋ค.
์ด๊ฒ์ด ๋ฐ๋ก Inference Inflection์ ๋๋ค. AI๊ฐ ์๊ฐํ๊ณ (Think), ํ๋ํ๊ณ (Do), ์ฝ๊ณ (Read), ์ถ๋ก ํ๊ณ (Reason), ์์ฑ(Generate)ํ ๋๋ง๋ค Inference๊ฐ ํ์ํฉ๋๋ค. ์ด์ Training์ ๋์ด Inference๊ฐ AI์ ํต์ฌ ์ํฌ๋ก๋๊ฐ ๋์์ต๋๋ค.
Jensen์ ์๋ GTC์์ 2026๋ ๊น์ง $500B์ ๊ณ ์ ๋ขฐ ์์๋ฅผ ์ ๋งํ๋๋ฐ, ์ฌํด๋ 2027๋ ๊น์ง ์ต์ $1T(1์กฐ ๋ฌ๋ฌ) ์ ์์๋ฅผ ํ์ธํ๋ค๊ณ ๋ฐํํ์ต๋๋ค.
-
2025๋ Inference์ ํด: Blackwell์ ์ฑ๊ณผ
2025๋ ์ NVIDIA์ โInference์ ํดโ์์ต๋๋ค. Hopper๊ฐ ์ ์ฑ๊ธฐ์ ์์ ๋ ๊ณผ๊ฐํ๊ฒ ์ํคํ ์ฒ๋ฅผ ์ฌ์ค๊ณํ์ฌ, NVLink 8์์ NVLink 72๋ก ํ์ฅํ๊ณ , ์์คํ ์ ์์ ํ Disaggregateํ์ต๋๋ค.
ํต์ฌ ๊ธฐ์ ํ์ ์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
- NVLink 72: 72๊ฐ GPU๋ฅผ NVLink๋ก ์ฐ๊ฒฐํ ๊ฑฐ๋ํ ๋จ์ผ ์ปดํจํ ์ ๋
- NVFP4: ์๋ก์ด Tensor Core ๋ฐ ์ฐ์ฐ ์ ๋. ์ ๋ฐ๋ ์์ค ์์ด Inference ์ฑ๋ฅ๊ณผ ์๋์ง ํจ์จ์ ํฌ๊ฒ ํฅ์. Training์๋ ์ ์ฉ ๊ฐ๋ฅ
- Dynamo: AI Factory๋ฅผ ์ํ ์ด์์ฒด์
- TensorRT-LLM: ์ถ๋ก ์ต์ ํ๋ฅผ ์ํ ์๊ณ ๋ฆฌ์ฆ ์คํ
Semi Analysis์ ๋๊ท๋ชจ AI Inference ๋ฒค์น๋งํฌ ๊ฒฐ๊ณผ์์, NVIDIA์ Grace Blackwell NVLink 72๋ Hopper H200 ๋๋น 35~50๋ฐฐ์ ์ฑ๋ฅ ํฅ์์ ๋ฌ์ฑํ์ต๋๋ค. Mooreโs Law ๊ธฐ์ค์ผ๋ก๋ 1.5๋ฐฐ ์ ๋๊ฐ ์์๋์์ ๊ฒ์ ๋๋ค.
Jensen์ Token Factory๋ผ๋ ๊ฐ๋ ์ ๋์ ํ์ต๋๋ค. ๋ฐ์ดํฐ์ผํฐ๋ ๋ ์ด์ ํ์ผ ์ ์ฅ์๊ฐ ์๋๋ผ, Token์ ์์ฐํ๋ ๊ณต์ฅ์ ๋๋ค. 1 Gigawatt ๋ฐ์ดํฐ์ผํฐ์์ Tokens/Watt(์ ๋ ฅ ๋น ํ ํฐ ์์ฐ๋)์ Token Speed(ํ ํฐ ์๋)๊ฐ ํต์ฌ ์งํ์ด๋ฉฐ, ์ด๊ฒ์ด ๊ณง ์์ต์ผ๋ก ์ง๊ฒฐ๋ฉ๋๋ค.
์ค์ ๋ก Fireworks, Together ๋ฑ์ Inference ์๋น์ค ์ ๊ณต ์ ์ฒด์ NVIDIA ์ํํธ์จ์ด ์ ๋ฐ์ดํธ๋ฅผ ์ ์ฉํ ๊ฒฐ๊ณผ, ๋์ผ ์์คํ ์์ ์ฝ 700 tokens/sec์์ ์ฝ 5,000 tokens/sec๋ก 7๋ฐฐ ํฅ์๋์์ต๋๋ค.
-
Vera Rubin: ์ฐจ์ธ๋ AI ์ํผ์ปดํจํฐ ํ๋ซํผ
8.1 10๋ ์ ์ํคํ ์ฒ ์งํ
Jensen์ DGX-1(2016)๋ถํฐ Vera Rubin๊น์ง์ 10๋ ์งํ๋ฅผ ์์ฝํ์ต๋๋ค.
- DGX-1 (2016, Pascal): ์ต์ด์ ๋ฅ๋ฌ๋ ์ ์ฉ ์ปดํจํฐ. NVLink 1์ธ๋, 170 TFLOPS
- DGX A100 (2020, Ampere): NVLink 3, Scale-up + Scale-out ๊ฒฐํฉ. Mellanox ํฉ๋ฅ
- Hopper: FP8 Transformer Engine ๋์ . Generative AI ์๋ ๊ฐ๋ง. NVLink 4, ConnectX-7, Quantum InfiniBand
- Grace Blackwell: NVLink 72, 72๊ฐ GPU ์ฐ๊ฒฐ, 130 Exabytes/sec. ConnectX-8, Spectrum X Ethernet
8.2 Vera Rubin ํ๋ซํผ ์์ธ
Vera Rubin์ Agentic AI ์๋๋ฅผ ์ํด ์ค๊ณ๋ ์ฐจ์ธ๋ ํ๋ซํผ์ผ๋ก, CPU/์คํ ๋ฆฌ์ง/๋คํธ์ํน/๋ณด์ ๋ฑ ์ปดํจํ ์ ๋ชจ๋ ์ถ์ ํ์ ํฉ๋๋ค.
7๊ฐ์ ์นฉ, 5๊ฐ์ ๋ ์ค์ผ์ผ ์ปดํจํฐ, 1๊ฐ์ ํ๋ช ์ AI ์ํผ์ปดํจํฐ:
- Vera Rubin GPU (NVLink 72): 3.6 Exaflops, 260 TB/sec All-to-All NVLink ๋์ญํญ
- Vera CPU: Agentic ์ํฌ๋ก๋๋ฅผ ์ํ ์ค์ผ์คํธ๋ ์ด์ ์ ์ฉ CPU. ์ธ๊ณ ์ ์ผ์ LPDDR5 ํ์ฌ ๋ฐ์ดํฐ์ผํฐ CPU. ๊ทน๋๋ก ๋์ ์ฑ๊ธ ์ค๋ ๋ ์ฑ๋ฅ๊ณผ ์๋์ง ํจ์จ. ๋ ๋ฆฝ ํ๋งค๋ง์ผ๋ก๋ ์์ญ์ต ๋ฌ๋ฌ ๊ท๋ชจ ์ฌ์
- STX Rack: BlueField ๊ธฐ๋ฐ์ AI Native ์คํ ๋ฆฌ์ง. KV Cache, cuDF, cuVS ๊ฐ์ ์คํ ๋ฆฌ์ง
- Groq LPX RC: Vera Rubin์ ๊ธด๋ฐํ๊ฒ ์ฐ๊ฒฐ๋ Token Accelerator. ๋์ฉ๋ On-chip SRAM ํ์ฌ. Vera Rubin ๋๋น 35๋ฐฐ ๋ ๋์ Throughput/Megawatt
- ConnectX-9 + BlueField 4: ์ฐจ์ธ๋ ๋คํธ์ํน
- Spectrum X CPO: ์ธ๊ณ ์ต์ด Co-Packaged Optics ์ค์์น. TSMC์ ๊ณต๋ ๊ฐ๋ฐํ CuP ๊ณต์ ๊ธฐ์ ๋ก ์์ฐ ์ค
10๋ ๊ฐ 4,000๋ง ๋ฐฐ์ ์ปดํจํ ์ฑ๋ฅ ํฅ์์ ๋ฌ์ฑํ์ต๋๋ค.
8.3 ๋ฌผ๋ฆฌ์ ์ค๊ณ ํน์ง
- 100% ์ก์ฒด ๋๊ฐ, ์ผ์ด๋ธ ์ ๊ฑฐ โ ์ค์น ์๊ฐ์ด 2์ผ์์ 2์๊ฐ์ผ๋ก ๋จ์ถ
- 45๋ ์จ์ ๋๊ฐ์ผ๋ก ๋ฐ์ดํฐ์ผํฐ ๋๊ฐ ๋น์ฉ๊ณผ ์๋์ง๋ฅผ ์์คํ ์ ํ์ฉ
- 6์ธ๋ NVLink Scale-up ์ค์์นญ ์์คํ (NVIDIA๋ง์ ๋ ์ ๊ธฐ์ )
8.4 Groq ํตํฉ: Disaggregated Inference
Jensen์ Groq ์ธ์์ ์ ๋ต์ ์๋ฏธ๋ฅผ ์์ธํ ์ค๋ช ํ์ต๋๋ค. Groq LPU๋ Deterministic Dataflow Processor๋ก, ์ ์ ์ปดํ์ผ/์ ์ ์ค์ผ์ค๋ง์ผ๋ก ๋์ํ๋ฉฐ, ๋์ฉ๋ SRAM์ผ๋ก ์ถ๋ก ์ ์ฉ์ผ๋ก ์ค๊ณ๋์์ต๋๋ค.
ํ์ง๋ง Groq ์นฉ ํ๋์๋ 500MB SRAM๋ง ์์ด์, Trillion Parameter ๋ชจ๋ธ์ ์ ์ฒด ํ๋ผ๋ฏธํฐ์ KV Cache๋ฅผ ๋ด๊ธฐ์ ์ญ๋ถ์กฑ์ด์์ต๋๋ค. NVIDIA๋ Dynamo๋ฅผ ํตํ Disaggregated Inference ์ํคํ ์ฒ๋ก ์ด ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ์ต๋๋ค.
- Prefill + Attention(Decode ์ค): Vera Rubin์ด ๋ด๋น (๋์ ์ํ ์ฐ์ฐ, ๋์ฉ๋ KV Cache)
- Feed-forward / Token Generation(Decode ์ค): Groq๊ฐ ๋ด๋น (์ ์ง์ฐ, ๋์ญํญ ํ์ ์ํฌ๋ก๋)
๋ ํ๋ก์ธ์๊ฐ Ethernet ์์์ ํน์ ๋ชจ๋(์ง์ฐ 50% ๊ฐ์)๋ก ๊ธด๋ฐํ๊ฒ ๊ฒฐํฉ๋ฉ๋๋ค. ๊ฒฐ๊ณผ์ ์ผ๋ก, ๊ฐ์ฅ ๋์ ๊ฐ์น์ ์๋น์ค ํฐ์ด์์ 35๋ฐฐ ์ฑ๋ฅ ํฅ์๊ณผ ํจ๊ป, ๊ธฐ์กด์๋ ๋ถ๊ฐ๋ฅํ๋ ์ด๊ณ ์ Token ์์ฑ ํฐ์ด๊ฐ ์๋ก ์ด๋ ธ์ต๋๋ค.
8.5 Token Economy ๋ถ์
Jensen์ Token์ ์๋ก์ด ์ํ(Commodity)์ผ๋ก ์ ์ํ๊ณ , Token Factory์ ๊ฒฝ์ ํ์ ์ค๋ช ํ์ต๋๋ค. 1 Gigawatt ๋ฐ์ดํฐ์ผํฐ์ ์ ๋ ฅ์ ์๋น์ค ํฐ์ด๋ณ๋ก ๋ฐฐ๋ถํ๋ ๋ชจ๋ธ์ ์ ์ํ์ต๋๋ค.
- Free Tier: ๋์ Throughput, ๋ฎ์ ์๋ โ ๊ณ ๊ฐ ์ ์น
- Medium Tier ($3/M tokens): ์ค๊ฐ ๋ชจ๋ธ ํฌ๊ธฐ, ์ค๊ฐ ์๋
- High Tier ($6~$45/M tokens): ๋ ํฐ ๋ชจ๋ธ, ๋ ๊ธด Context, ๋ ๋์ ์๋ โ ์ค๋งํธํ AI
- Premium Tier ($150/M tokens): ์ต๊ณ ์๋ Token ์์ฑ. ์ฐ๊ตฌํ์ด ํ๋ฃจ 5์ฒ๋ง Token์ ์ฌ์ฉํด๋ ๋น์ฉ์ด ๋ถ๋ด๋์ง ์๋ ์์ค
Blackwell โ Vera Rubin์ผ๋ก์ ์ ํ์ ๋์ผ ์ ๋ ฅ์์ 5๋ฐฐ์ ์์ต ์ฆ๊ฐ๋ฅผ ์๋ฏธํฉ๋๋ค. Groq๋ฅผ 25% ์ถ๊ฐํ๋ฉด ์์ต์ ๋ ํ์ฅํ ์ ์์ต๋๋ค. ๋ํ Vera Rubin์ 2๋ ๋ด์ 1GW ํฉํ ๋ฆฌ์์ Token ์์ฑ ์๋๋ฅผ 2,200๋ง์์ 7์ต์ผ๋ก, 350๋ฐฐ ํฅ์์ํฌ ์ ๋ง์ ๋๋ค.
Samsung์ด Groq LP30 ์นฉ์ ์ ์กฐํ๋ฉฐ, Q3์ ์ถํ ์์ ์ ๋๋ค. Vera Rubin RC(Research Chip)๋ ์ด๋ฏธ Microsoft Azure์์ ๊ฐ๋ ์ค์ ๋๋ค.
-
๋ก๋๋งต: Rubin Ultra์์ Feynman๊น์ง
9.1 ํ์ฌ ~ ๊ทผ๋ฏธ๋
- Grace Blackwell (ํ์ฌ): Oberon ์์คํ . ๊ธฐ์กด ๋ ์์คํ ๊ณผ ํธํ
- Vera Rubin: Oberon ์์คํ . Copper Scale-up(NVLink 72) + Optical Scale-up(NVLink 576) ๋ชจ๋ ์ง์
- Vera Rubin Ultra: ์๋ก์ด Rubin Ultra ์นฉ + LP35(NVFP4 ๋ด์ฅ). Kyber ๋ ์์คํ ์ผ๋ก NVLink 144 ์ง์. 144๊ฐ GPU๋ฅผ ํ๋์ NVLink ๋๋ฉ์ธ์ผ๋ก ์ฐ๊ฒฐ
9.2 ์ฐจ์ธ๋: Feynman
- ์๋ก์ด GPU
- LP40: NVIDIA์ Groq ํ์ ํตํฉ ์ค๊ณ. ๋ํญ์ ์ธ ์ฑ๋ฅ ํฅ์
- Rosa CPU (Sure for Rosa)
- BlueField 5 + ConnectX-10
- Kyber Copper Scale-up + Kyber CPO Scale-up: ์ต์ด๋ก Copper์ Co-Packaged Optics ๋ ๊ฐ์ง๋ก Scale-up ๊ฐ๋ฅ
Jensen์ Copper, Optical Scale-up, Optical Scale-out ๋ชจ๋๊ฐ ํ์ํ๋ฉฐ, ๋ชจ๋ ๋ฐฉ์์ ์ฉ๋์ ๋ํญ ๋๋ ค์ผ ํ๋ค๊ณ ๊ฐ์กฐํ์ต๋๋ค.
-
AI Factory ํ๋ซํผ: NVIDIA DGX
NVIDIA๋ ์นฉ ํ์ฌ์์ AI Factory ํ์ฌ๋ก ์งํํ์ต๋๋ค. AI Factory ๋ด๋ถ์์ ๋ญ๋น๋๋ ์ ๋ ฅ์ ์ต์ํํ๊ธฐ ์ํด, NVIDIA DGX ํ๋ซํผ์ ๋ง๋ค์์ต๋๋ค.
- Omniverse DGX World: ๋ชจ๋ ๊ตฌ์ฑ์์ ์ ์กฐ์ฌ๊ฐ ๊ฐ์์ผ๋ก ๋ง๋ Gigawatt ๊ท๋ชจ AI Factory๋ฅผ ์ค๊ณํ๋ Digital Twin ํ๋ซํผ
- DGX Sim: ๋์ ๊ธฐ๊ณ/์ด/์ ๊ธฐ/๋คํธ์ํน ์๋ฎฌ๋ ์ด์ . Siemens Star-CCM+, Cadence, ETAP ๋ฑ์ ๋๊ตฌ์ ํตํฉ
- DGX Exchange: AI Factory ์ด์ ๋ฐ์ดํฐ ๊ตํ
- DGX Flex: ๊ทธ๋ฆฌ๋์ ๋ฐ์ดํฐ์ผํฐ ๊ฐ ๋์ ์ ๋ ฅ ๊ด๋ฆฌ
- DGX Max-Q: ๋์ ์ผ๋ก Token Throughput ์ต๋ํ
Digital Twin์ด ์ด์์๊ฐ ๋์ด, AI Agent๊ฐ DGX Max-Q์ ํ๋ ฅํ์ฌ ์ธํ๋ผ๋ฅผ ๋์ ์ผ๋ก ์ค์ผ์คํธ๋ ์ด์ ํฉ๋๋ค. Jensen์ ์ฌ๊ธฐ์ 2๋ฐฐ์ ํจ์จ ๊ฐ์ ๊ฐ๋ฅ์ฑ์ด ์๋ค๊ณ ์ธ๊ธํ์ต๋๋ค.
๋ํ Vera Rubin Space 1์ด๋ผ๋ ์ฐ์ฃผ์ฉ ์ปดํจํฐ๋ ๋ฐํํ์ต๋๋ค. Thor ์นฉ์ด ์ด๋ฏธ ๋ฐฉ์ฌ์ ์ธ์ฆ์ ๋ฐ์ ์์ฑ์ ํ์ฌ๋์ด ์์ผ๋ฉฐ, ํฅํ ์ฐ์ฃผ์ ๋ฐ์ดํฐ์ผํฐ๋ฅผ ๊ตฌ์ถํ ๊ณํ์ ๋๋ค.
-
OpenClaw: Agentic AI์ Linux
ํค๋ ธํธ์ ๊ฐ์ฅ ์ค์ํ ๋ฐํ ์ค ํ๋๋ OpenClaw์ ๋ํ NVIDIA์ ์ง์ ๋ฐํ์์ต๋๋ค. Peter Steinberger๊ฐ ๊ฐ๋ฐํ OpenClaw๋ ์ธ๋ฅ ์ญ์ฌ์ ๊ฐ์ฅ ๋น ๋ฅด๊ฒ ์ฑ์ฅํ ์คํ์์ค ํ๋ก์ ํธ๋ก, ๋ถ๊ณผ ๋ช ์ฃผ ๋ง์ Linux๊ฐ 30๋ ๊ฐ ๋ฌ์ฑํ ๊ฒ์ ๋์ด์ฐ์ต๋๋ค.
11.1 OpenClaw๋ ๋ฌด์์ธ๊ฐ
Jensen์ OpenClaw๋ฅผ ์ด์์ฒด์ (OS)์ ๋ฌธ๋ฒ์ผ๋ก ์ค๋ช ํ์ต๋๋ค.
- ๋ฆฌ์์ค ๊ด๋ฆฌ: ํ์ผ ์์คํ , ๋๊ตฌ, LLM ์ ๊ทผ
- ์ค์ผ์ค๋ง: Cron Job, ๋ฌธ์ ๋ถํด, ์๋ธ ์์ด์ ํธ ํธ์ถ
- I/O: ๋ฉํฐ๋ชจ๋ฌ ์ ์ถ๋ ฅ (์์ฑ, ์ ์ค์ฒ, ๋ฉ์์ง, ์ด๋ฉ์ผ ๋ฑ)
๊ฒฐ๋ก ์ ์ผ๋ก, OpenClaw๋ Agentic Computer์ ์ด์์ฒด์ ๋ฅผ ์คํ์์คํํ ๊ฒ์ ๋๋ค. Windows๊ฐ PC ์๋๋ฅผ ์ด์๋ฏ, OpenClaw๋ Personal Agent ์๋๋ฅผ ์ด์์ต๋๋ค.
๋ชจ๋ ๊ธฐ์ ์ด Linux ์ ๋ต, HTTP/HTML ์ ๋ต, Kubernetes ์ ๋ต์ ๊ฐ์ ธ์ผ ํ๋ฏ์ด, ์ด์ ๋ชจ๋ ๊ธฐ์ ์ OpenClaw ์ ๋ต์ด ํ์ํฉ๋๋ค.
11.2 Enterprise IT์ ๋ณํ
๊ธฐ์กด IT ์ฐ์ ์ ๋ฐ์ดํฐ์ผํฐ(ํ์ผ ์ ์ฅ) โ ์ํํธ์จ์ด(๋๊ตฌ/์ํฌํ๋ก์ฐ) โ ์ฌ๋(๋๊ตฌ ์ฌ์ฉ)์ ๊ตฌ์กฐ์์ต๋๋ค. Post-OpenClaw ์๋์๋ ๋ชจ๋ SaaS ํ์ฌ๊ฐ AaaS(Agentic as a Service) ํ์ฌ๊ฐ ๋ฉ๋๋ค.
ํ์ง๋ง Agentic ์์คํ ์ ๊ธฐ์ ๋คํธ์ํฌ์์ ๋ฏผ๊ฐํ ์ ๋ณด์ ์ ๊ทผํ๊ณ , ์ฝ๋๋ฅผ ์คํํ๊ณ , ์ธ๋ถ์ ํต์ ํ ์ ์์ต๋๋ค. ์ด๋ ์ฌ๊ฐํ ๋ณด์ ์ํ์ ์๋ฏธํฉ๋๋ค.
11.3 NVIDIA NemoClaw: Enterprise ๋ณด์
NVIDIA๋ Peter Steinberger์ ํ๋ ฅํ์ฌ OpenClaw๋ฅผ Enterprise ํ๊ฒฝ์ ์ ํฉํ๊ฒ ๋ง๋ NemoClaw ๋ ํผ๋ฐ์ค ๋์์ธ์ ๋ฐํํ์ต๋๋ค.
- OpenShell: ๋ณด์ ๋ฐ ํ๋ผ์ด๋ฒ์ ๊ณ์ธต. OpenClaw์ ํตํฉ
- ๋คํธ์ํฌ ๊ฐ๋๋ ์ผ + ํ๋ผ์ด๋ฒ์ ๋ผ์ฐํฐ: Agent์ ํ๋ ๋ฒ์๋ฅผ ์์ ํ๊ฒ ์ ํ
- SaaS ํ์ฌ์ Policy Engine ์ฐ๊ฒฐ: ๊ธฐ์กด ๋ณด์ ์ ์ฑ ์ NemoClaw์ ์ฐ๊ฒฐ ๊ฐ๋ฅ
-
NVIDIA Open Model Initiative
NVIDIA๋ ๋ชจ๋ AI ๋๋ฉ์ธ์์ Frontier ์์ค์ ์คํ ๋ชจ๋ธ์ ์ ๊ณตํ๊ณ ์์ต๋๋ค. 6๊ฐ์ ์คํ Frontier ๋ชจ๋ธ ํจ๋ฐ๋ฆฌ์ ํ์ต ๋ฐ์ดํฐ/๋ ์ํผ/ํ๋ ์์ํฌ๋ฅผ ๊ณต๊ฐํฉ๋๋ค.
- Nemotron: ์ธ์ด, ์๊ฐ ์ดํด, RAG, Safety, ์์ฑ์ ์ํ Reasoning ๋ชจ๋ธ. Nemotron 3๊ฐ OpenClaw ๋ด์์ ์ธ๊ณ ์์ 3๊ฐ ๋ชจ๋ธ์ ํฌํจ
- Cosmos: Physical AI๋ฅผ ์ํ World Foundation Model
- ALMA (Alphamo): ์์จ์ฃผํ AI
- GR00T: ๋ฒ์ฉ ๋ก๋ด์ ์ํ Foundation Model
- BioNeMo: ์๋ฌผํ, ํํ, ๋ถ์ ์ค๊ณ
- Earth Models: ๋ ์จ/๊ธฐํ ์์ธก (AI Physics ๊ธฐ๋ฐ)
Nemotron 3 Ultra๋ ์ธ๊ณ ์ต๊ณ ์ Base Model๋ก, ๊ฐ ๊ตญ๊ฐ์ Sovereign AI ๊ตฌ์ถ์ ์ง์ํฉ๋๋ค.
Nemotron 4 Coalition
Nemotron 4๋ฅผ ๋ ๋ฐ์ ์ํค๊ธฐ ์ํ ์ฐํฉ์ฒด๊ฐ ๋ฐํ๋์์ต๋๋ค. ์ฐธ์ฌ ๊ธฐ์ ์ผ๋ก๋ Black Forest Labs, Cursor, LangChain, Mistral, Perplexity, Reflection, Sarvam(์ธ๋), Thinking Machines, Urban Labs ๋ฑ์ด ์์ต๋๋ค.
Jensen์ ๋ฏธ๋์ ๋ชจ๋ ์์ง๋์ด๊ฐ ์ฐ๋ด ์ธ์ ์ฐ๊ฐ Token ์์ฐ์ ๋ฐ๊ฒ ๋ ๊ฒ์ด๋ผ๊ณ ์ ๋งํ์ต๋๋ค. Token์ด ์์ง๋์ด์ ์์ฐ์ฑ์ 10๋ฐฐ๋ก ๋์ผ ์ ์๊ธฐ ๋๋ฌธ์, โ์ด ์ง๋ฌด์๋ Token์ด ์ผ๋ง๋ ํฌํจ๋๋์?โ๊ฐ ์ค๋ฆฌ์ฝ๋ฐธ๋ฆฌ์ ์๋ก์ด ์ฑ์ฉ ์ง๋ฌธ์ด ๋๊ณ ์๋ค๊ณ ๋ง๋ถ์์ต๋๋ค.
-
Physical AI์ ๋ก๋ณดํฑ์ค
ํค๋ ธํธ์ ๋ง์ง๋ง ๋์ฃผ์ ๋ Physical AI, ์ฆ ๋ฌผ๋ฆฌ ์ธ๊ณ์์ ์๋ํ๋ Embodied Agent(๋ก๋ด)์์ต๋๋ค.
13.1 ๋ก๋ณดํฑ์ค ์ํ๊ณ
GTC์ 110๋์ ๋ก๋ด์ด ์ ์๋์์ผ๋ฉฐ, NVIDIA๋ ๋ก๋ด ๊ฐ๋ฐ์ ์ํ 3๋ ์ปดํจํฐ๋ฅผ ์ ๊ณตํฉ๋๋ค.
- Training Computer: ๋ชจ๋ธ ํ๋ จ
- Synthetic Data Generation & Simulation Computer: ํฉ์ฑ ๋ฐ์ดํฐ ์์ฑ ๋ฐ ์๋ฎฌ๋ ์ด์
- Robotics Computer: ๋ก๋ด ๋ด๋ถ ํ์ฌ
ํํธ๋๋ก๋ Siemens, Cadence ๋ฑ์ด ์์ผ๋ฉฐ, ์๋ก์ด ํํธ๋๋ ๋๊ฑฐ ๋ฐํ๋์์ต๋๋ค.
13.2 ์์จ์ฃผํ: ChatGPT Moment ๋๋
Jensen์ ์์จ์ฃผํ์ โChatGPT Momentโ๊ฐ ๋์ฐฉํ๋ค๊ณ ์ ์ธํ์ต๋๋ค.
- ์๋ก์ด Robo-Taxi ํํธ๋: BYD, Hyundai, Nissan, Geely (์ฐ๊ฐ 1,800๋ง ๋ ์์ฐ). ๊ธฐ์กด ํํธ๋ Mercedes, Toyota, GM์ ์ถ๊ฐ
- Uber์์ ๋๊ท๋ชจ ํํธ๋์ญ: ๋ค์์ ๋์์์ Robo-Taxi๋ฅผ Uber ๋คํธ์ํฌ์ ์ฐ๊ฒฐ
- NVIDIA Alphamo: ์์จ์ฃผํ AI ํ๋ซํผ. ์ฐจ๋์ Reasoning ๋ฅ๋ ฅ์ ๋ถ์ฌํ์ฌ, ์ํฉ์ ์ค๋ช ํ๊ณ ์ง์๋ฅผ ๋ฐ๋ฅด๋ ๋ชจ์ต์ ์์ฐํ์ต๋๋ค
13.3 ์ฐ์ ์ฉ ๋ก๋ณดํฑ์ค
ABB, Universal Robotics, KUKA ๋ฑ์ ๋ก๋ณดํฑ์ค ๊ธฐ์ ๋ค๊ณผ ํ๋ ฅํ์ฌ Physical AI ๋ชจ๋ธ์ ์๋ฎฌ๋ ์ด์ ์์คํ ์ ํตํฉํ๊ณ , ์ ์กฐ ๋ผ์ธ์ ๋ฐฐํฌํฉ๋๋ค. Caterpillar, Foxconn ๋ฑ๋ ์ฐธ์ฌํฉ๋๋ค.
T-Mobile๊ณผ๋ ๊ธฐ์ง๊ตญ์ AI RAN(Robotics Radio Tower)๋ก ์ ํํ๋ ํํธ๋์ญ์ ๋งบ์์ต๋๋ค. AI๊ฐ ํธ๋ํฝ์ ๋ถ์ํ๊ณ ๋นํฌ๋ฐ์ ๋์ ์กฐ์ ํ์ฌ ์๋์ง ์ ์ฝ๊ณผ ํ์ง ํฅ์์ ๋์์ ๋ฌ์ฑํฉ๋๋ค.
13.4 Physical AI ์ํํธ์จ์ด ์คํ
ํ์ค ์ธ๊ณ์ ๋ฐ์ดํฐ๋ง์ผ๋ก๋ ๋ชจ๋ ์๋๋ฆฌ์ค๋ฅผ ์ปค๋ฒํ ์ ์๊ธฐ ๋๋ฌธ์, AI์ ์๋ฎฌ๋ ์ด์ ์ผ๋ก ์์ฑํ ํฉ์ฑ ๋ฐ์ดํฐ๊ฐ ํ์์ ์ ๋๋ค. โCompute is Dataโ๋ผ๋ ์์น ์๋, NVIDIA๋ ๋ค์ ์ํํธ์จ์ด๋ฅผ ์ ๊ณตํฉ๋๋ค.
- Isaac Lab: ๋ก๋ด ํ๋ จ ๋ฐ ํ๊ฐ ์๋ฎฌ๋ ์ด์ (์คํ์์ค)
- Newton: GPU ๊ฐ์ Differentiable Physics ์๋ฎฌ๋ ์ด์ (ํ์ฅ ๊ฐ๋ฅ)
- Cosmos World Models: Neural Simulation
- GR00T: ๋ก๋ด ์ถ๋ก ๋ฐ ํ๋ ์์ฑ์ ์ํ Open Foundation Model
์ฌ๋ก๋ก๋ Pitts AI(์์ ์ค ๋ณด์กฐ ๋ก๋ด), Skild AI(RL ๊ธฐ๋ฐ ๋ชจ๋ธ ๊ฐํ), Humanoid(์ ์ ์ ์ด), Hexagon Robotics, Foxconn, Noble Machines ๋ฑ์ด ์๊ฐ๋์์ต๋๋ค.
13.5 Disney + NVIDIA: Olaf ๋ก๋ด ์์ฐ
ํค๋ ธํธ์ ํ์ด๋ผ์ดํธ ์ค ํ๋๋ก, Disney Research๊ฐ Newton ๋ฌผ๋ฆฌ ์๋ฎฌ๋ ์ดํฐ์ Isaac Lab์ ์ฌ์ฉํด ํ๋ จํ Olaf(์ฌ๋ผํ) ๋ก๋ด์ด ๋ฌด๋์ ๋ฑ์ฅํ์ต๋๋ค. NVIDIA Warp ์์์ ๋์ํ๋ Newton Solver๋ฅผ DeepMind์ ๊ณต๋ ๊ฐ๋ฐํ์ผ๋ฉฐ, ์ด๋ฅผ ํตํด ์ฌ๋ผํ๊ฐ ๋ฌผ๋ฆฌ ์ธ๊ณ์ ์ ์ํ๋ ๋ชจ์ต์ ๋ณด์ฌ์ฃผ์์ต๋๋ค.
Jensen์ ๋ฏธ๋์ ๋์ฆ๋๋๋์์ ์ด๋ฐ ์บ๋ฆญํฐ ๋ก๋ด๋ค์ด ๋์๋ค๋๋ ๋ชจ์ต์ ์์ํด๋ณด๋ผ๊ณ ๋งํ์ต๋๋ค.
-
๋ง๋ฌด๋ฆฌ: 4๋ ๋ฉ๊ฐ ํธ๋ ๋
Jensen์ ํค๋ ธํธ๋ฅผ 4๊ฐ์ง ํต์ฌ ์ฃผ์ ๋ก ์์ฝํ์ต๋๋ค.
- Inference Inflection: AI์ ํต์ฌ ์ํฌ๋ก๋๊ฐ Training์์ Inference๋ก ์ ํ. ์ปดํจํ ์์ 100๋ง ๋ฐฐ ์ฆ๊ฐ. $1T+ ์ธํ๋ผ ์์
- AI Factory: ๋ฐ์ดํฐ์ผํฐ์์ Token Factory๋ก์ ์ ํ. Tokens/Watt๊ฐ ํต์ฌ KPI. NVIDIA DGX ํ๋ซํผ์ผ๋ก ์ค๊ณ-๊ฑด์ค-์ด์ ์ต์ ํ
- OpenClaw Agent Revolution: Agentic AI์ ์คํ์์ค OS. ๋ชจ๋ ๊ธฐ์ ์ IT๊ฐ Agentic as a Service๋ก ์ ํ. NemoClaw๋ก Enterprise ๋ณด์ ํ๋ณด
- Physical AI & Robotics: ์์จ์ฃผํ์ ChatGPT Moment. ํฉ์ฑ ๋ฐ์ดํฐ + ์๋ฎฌ๋ ์ด์ ์ผ๋ก Physical AI ๋ฐ์ดํฐ ๋ฌธ์ ํด๊ฒฐ. Isaac Lab, Newton, Cosmos, GR00T ์ํํธ์จ์ด ์คํ
์ด๋ฒ GTC 2026์ NVIDIA๊ฐ ๋จ์ํ GPU ํ์ฌ๊ฐ ์๋๋ผ, AI ์๋์ ํ์คํ ํ๋ซํผ ํ์ฌ๋ก ์์ ํ ์งํํ์์ ๋ณด์ฌ์ฃผ๋ ํ์ฌ์์ต๋๋ค. Vertically Integrated, Horizontally Open์ด๋ผ๋ ์ ๋ต ์๋, ์นฉ-์์คํ -์ํํธ์จ์ด-AI ๋ชจ๋ธ-์ํ๊ณ๋ฅผ ์์ฐ๋ฅด๋ NVIDIA์ ํฌ์ง์ ๋์ ํฅํ AI ์ฐ์ ์ ๋ฐฉํฅ์ ์ดํดํ๋ ๋ฐ ํต์ฌ์ ์ธ ํ๋ ์์ํฌ๊ฐ ๋ ๊ฒ์ ๋๋ค.
์ฝ์ด์ฃผ์ ์ ๊ฐ์ฌํฉ๋๋ค :)