[OpenAI] GPT Realtime API: μμ± κΈ°λ° AI μμ΄μ νΈμ μλ‘μ΄ μ νμ
μλ³Έ κ²μκΈ: https://velog.io/@euisuk-chung/OpenAI-GPT-Realtime-API
OpenAI GPT-Realtime
νλ‘λμ μμ€μ μμ± AI μμ΄μ νΈλ₯Ό μν νμ μ μΈ Speech-to-Speech λͺ¨λΈ
λ€μ΄κ°λ©°
μμ± μΈν°νμ΄μ€λ μΈκ°μ΄ AIμ μνΈμμ©νλ κ°μ₯ μμ°μ€λ¬μ΄ λ°©μ μ€ νλμ λλ€. κ³ κ° μ§μλΆν° κ΅μ‘, ν¬μ€μΌμ΄κΉμ§ λ€μν μ°μ μμ μΈκ° μμ€μ μμ± νμ§μ κ°μ§ AI κ²½νμ λν μμκ° κΈμ¦νκ³ μμ΅λλ€. μ΅κ·Ό OpenAIλ μ΄λ¬ν μμ₯ μꡬμ μλ΅νμ¬ GPT-Realtimeμ΄λΌλ μλ‘μ΄ Speech-to-Speech λͺ¨λΈκ³Ό ν¨κ» Realtime APIμ μ μ μΆμλ₯Ό λ°ννμ΅λλ€.
μ΄λ² λ°νλ λ¨μν κΈ°μ‘΄ λͺ¨λΈμ μ κ·Έλ μ΄λλ₯Ό λμ΄μ, μ ν΅μ μΈ Speech-to-Text β Text-to-Speech νμ΄νλΌμΈμ νκ³λ₯Ό 극볡νλ νμ μ μΈ μ κ·Ό λ°©μμ μ μν©λλ€. λ³Έ λΈλ‘κ·Έμμλ GPT-Realtimeμ ν΅μ¬ κΈ°λ₯, κΈ°μ μ κ°μ μ¬ν, κ·Έλ¦¬κ³ μ€μ κΈ°μ νμ© μ¬λ‘λ₯Ό ν΅ν΄ μμ± AIμ μλ‘μ΄ ν¨λ¬λ€μμ μ΄ν΄λ³΄κ² μ΅λλ€.
λ°°κ²½: Speech-to-Speech λͺ¨λΈμ μν€ν μ²μ μ°μ
μ ν΅μ μΈ μμ± AI νμ΄νλΌμΈμ νκ³
κΈ°μ‘΄μ μμ± AI μμ€ν μ λ€μκ³Ό κ°μ λ€λ¨κ³ μ²λ¦¬ κ³Όμ μ κ±°μ³€μ΅λλ€:
- Speech-to-Text (STT): μμ±μ ν μ€νΈλ‘ λ³ν
- Text Processing: μΈμ΄ λͺ¨λΈμ΄ ν μ€νΈλ₯Ό μ²λ¦¬νμ¬ μλ΅ μμ±
- Text-to-Speech (TTS): μλ΅ ν μ€νΈλ₯Ό μμ±μΌλ‘ λ³ν
μ΄λ¬ν μ²΄μΈ λ°©μμ μ¬λ¬ λͺ¨λΈμ μ°κ²°νλ©΄μ λ€μκ³Ό κ°μ λ¬Έμ μ λ€μ μΌκΈ°νμ΅λλ€:
- λ μ΄ν΄μ μ¦κ°: κ° λ¨κ³λ³ μ²λ¦¬ μκ°μ΄ λμ λ¨
- λμμ€ μμ€: μμ±μ κ°μ μ μμλ λΉμΈμ΄μ μ νΈκ° ν μ€νΈ λ³ν κ³Όμ μμ μμ€
- 볡μ‘ν ꡬν: μ¬λ¬ λͺ¨λΈ κ°μ ν΅ν© λ° μ΅μ ν 볡μ‘μ±
Speech-to-Speech λͺ¨λΈμ νμ μ μ κ·Ό
GPT-Realtimeμ μ΄λ¬ν νκ³λ₯Ό 극볡νκΈ° μν΄ end-to-end Speech-to-Speech μν€ν μ²λ₯Ό μ±ννμ΅λλ€:
1
2
3
4
5
# μ ν΅μ μΈ λ°©μ
audio_input β STT_model β text β LLM β response_text β TTS_model β audio_output
# GPT-Realtime λ°©μ
audio_input β GPT_Realtime β audio_output
μ΄ λ¨μΌ λͺ¨λΈ μ κ·Όλ²μ λ€μκ³Ό κ°μ μν€ν μ²μ μ°μλ₯Ό μ 곡ν©λλ€:
- μ μ§μ° μ²λ¦¬: λ¨μΌ λͺ¨λΈμ ν΅ν μ§μ μ μΈ audio-to-audio λ³ν
- λμμ€ λ³΄μ‘΄: μμ, νμ¨ κ°μ λΉμΈμ΄μ μ νΈκΉμ§ μ΄ν΄νκ³ μμ±
- μμ°μ€λ¬μ΄ κ°μ νν: κ΄λ²μν κ°μ μ€ννΈλΌμΌλ‘ μΈκ°λ€μ΄ μμ± μμ±
- μΈμ΄ μ ν: λ¬Έμ₯ μ€κ°μμλ λ§€λλ¬μ΄ μΈμ΄ λ³ν κ°λ₯
GPT-Realtimeμ ν΅μ¬ κΈ°λ₯ λΆμ
OpenAI Blog: https://openai.com/index/introducing-gpt-realtime/
1. μ€λμ€ νμ§ νμ
GPT-Realtimeμ μ€μ λνμμ μ€μν μμ°μ€λ¬μ΄ μ΅μ, κ°μ , μλλ₯Ό ꡬνν μ μλλ‘ νλ ¨λμμ΅λλ€.
λͺ¨λΈμ λ€μκ³Ό κ°μ μΈλ°ν μ§μμ¬νμ λ°λ₯Ό μ μμ΅λλ€:
Original Prompt:
1
2
"speak quickly and professionally"
"speak empathetically in a French accent"
Korean Translation:
1
2
"λΉ λ₯΄κ³ μ λ¬Έμ μΌλ‘ λ§ν΄μ£ΌμΈμ"
"νλμ€ μ΅μμΌλ‘ 곡κ°μ μΌλ‘ λ§ν΄μ£ΌμΈμ"
μλ‘κ² μΆμλ λ κ°μ μμ±μΈ Marinκ³Ό Cedarλ κ°μ₯ ν° κ°μ μ 보μ¬μ£Όλ©°, κΈ°μ‘΄ 8κ° μμ±λ μ΄λ¬ν κ°μ μ¬νμ λ°μνμ¬ μ λ°μ΄νΈλμμ΅λλ€.
OpenAI Blog: https://openai.com/index/introducing-gpt-realtime/
2. μ§λ₯μ±κ³Ό μ΄ν΄ λ₯λ ₯ ν₯μ
GPT-Realtimeμ Big Bench Audio νκ°μμ 82.8%μ μ νλλ₯Ό λ¬μ±νμ¬, 2024λ 12μ λͺ¨λΈμ 65.6%λ₯Ό ν¬κ² μννμ΅λλ€.
λͺ¨λΈ | Big Bench Audio μ νλ |
---|---|
gpt-realtime | 82.8% |
gpt-4o-realtime-preview-2025-06-03 | 81.5% |
gpt-4o-realtime-preview-2024-12-17 | 65.6% |
OpenAI Blog: https://openai.com/index/introducing-gpt-realtime/
λͺ¨λΈμ κ°μ λ μ΄ν΄ λ₯λ ₯μ λ€μκ³Ό κ°μ νΉμ§λ€λ‘ λνλ©λλ€:
- λΉμΈμ΄μ μ νΈ μΈμ: μμ, νμ¨ λ±μ κ°μ§
- μ€μκ° μΈμ΄ μ ν: λ¬Έμ₯ μ€κ°μμλ μμ°μ€λ¬μ΄ μΈμ΄ λ³κ²½
- ν€ μ μ: βκ°κ²°νκ³ μ λ¬Έμ β vs βμΉμ νκ³ κ³΅κ°μ β μ€νμΌ κ΅¬λΆ
- λ€κ΅μ΄ μμ«μ μΈμ: μ νλ²νΈ, VIN λ±μ μ€νμΈμ΄, μ€κ΅μ΄, μΌλ³Έμ΄, νλμ€μ΄λ‘ μ νν μΈμ
3. λͺ λ Ή μ€μ μ±λ₯
MultiChallenge Audio λ²€μΉλ§ν¬μμ GPT-Realtimeμ 30.5%μ μ νλλ₯Ό κΈ°λ‘νμ¬, μ΄μ λͺ¨λΈ λλΉ μλΉν κ°μ μ 보μ¬μ£Όμμ΅λλ€.
λͺ¨λΈ | MultiChallenge Audio μ νλ |
---|---|
gpt-realtime | 30.5% |
gpt-4o-realtime-preview-2025-06-03 | 26.5% |
gpt-4o-realtime-preview-2024-12-17 | 20.6% |
OpenAI Blog: https://openai.com/index/introducing-gpt-realtime/
μ΄λ¬ν κ°μ μ κ°λ°μκ° μ€μ ν μμ€ν μ§μμ¬νμ λν λͺ¨λΈμ λμ μΆ©μ€λλ₯Ό μλ―Έν©λλ€.
4. ν¨μ νΈμΆ μ΅μ ν
ComplexFuncBench Audio νκ°μμ GPT-Realtimeμ 66.5%μ μ νλλ₯Ό λ¬μ±νμ΅λλ€:
λͺ¨λΈ | ComplexFuncBench Audio μ νλ |
---|---|
gpt-realtime | 66.5% |
gpt-4o-realtime-preview-2025-06-03 | 58.9% |
gpt-4o-realtime-preview-2024-12-17 | 49.7% |
OpenAI Blog: https://openai.com/index/introducing-gpt-realtime/
κ°μ λ ν¨μ νΈμΆ λ₯λ ₯μ μΈ κ°μ§ μΆ:
- κ΄λ ¨ ν¨μ νΈμΆ: μν©μ μ ν©ν ν¨μ μ ν
- μ μ ν νμ΄λ°: ν¨μλ₯Ό νΈμΆν΄μΌ ν μ΅μ μ μκ° νλ¨
- μ νν μΈμ: ν¨μ μ€νμ νμν μ¬λ°λ₯Έ λ§€κ°λ³μ μ λ¬
λν λΉλκΈ° ν¨μ νΈμΆ κΈ°λ₯λ ν₯μλμ΄, μ₯μκ° μ€νλλ ν¨μ νΈμΆμ΄ λνμ νλ¦μ λ°©ν΄νμ§ μλλ‘ κ°μ λμμ΅λλ€.
Realtime APIμ μλ‘μ΄ κΈ°λ₯λ€
1. μ격 MCP μλ² μ§μ
MCP(Model Context Protocol) μ§μμ ν΅ν΄ κ°λ°μλ€μ μμ± μμ΄μ νΈμ μλ‘μ΄ κΈ°λ₯μ μ½κ² μΆκ°ν μ μμ΅λλ€.
OpenAI Blog: https://openai.com/index/introducing-gpt-realtime/
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
// POST /v1/realtime/client_secrets - μ€μκ° ν΄λΌμ΄μΈνΈ μν¬λ¦Ώ μμ±
{
"session": {
"type": "realtime", // μ€μκ° μΈμ
νμ
"tools": [
{
"type": "mcp", // MCP λꡬ νμ
"server_label": "stripe", // Stripe μλ² λΌλ²¨
"server_url": "https://mcp.stripe.com", // MCP μλ² URL
"authorization": "{access_token}", // μ κ·Ό ν ν°
"require_approval": "never" // μΉμΈ μꡬ μ€μ : μμ
}
]
}
}
For more, go to OpenAI Guide, https://platform.openai.com/docs/guides/realtime-conversations
2. μ΄λ―Έμ§ μ λ ₯ μ§μ
μ΄μ GPT-Realtimeμ μ€λμ€λ ν μ€νΈμ ν¨κ» μ΄λ―Έμ§, μ¬μ§, μ€ν¬λ¦°μ·μ μ²λ¦¬ν μ μμ΅λλ€.
OpenAI Blog: https://openai.com/index/introducing-gpt-realtime/
1
2
3
4
5
6
7
8
9
10
11
12
13
14
{
"type": "conversation.item.create", // λν μμ΄ν
μμ±
"previous_item_id": null, // μ΄μ μμ΄ν
ID (μμ)
"item": {
"type": "message", // λ©μμ§ νμ
"role": "user", // μ¬μ©μ μν
"content": [
{
"type": "input_image", // μ
λ ₯ μ΄λ―Έμ§ νμ
"image_url": "data:image/{format(example: png)};base64,{some_base64_image_bytes}" // Base64 μΈμ½λ©λ μ΄λ―Έμ§ λ°μ΄ν°
}
]
}
}
For more, go to OpenAI Guide, https://platform.openai.com/docs/guides/realtime-conversations
3. μΆκ°μ μΈ νλ‘λμ κΈ°λ₯λ€
- SIP(Session Initiation Protocol) μ§μ: 곡μ€μ νλ§, PBX μμ€ν , λ°μ€ν¬ν°κ³Όμ μ§μ μ°κ²°
- μ¬μ¬μ© κ°λ₯ν ν둬ννΈ: κ°λ°μ λ©μμ§, λꡬ, λ³μ, μμ λνλ₯Ό μΈμ κ°μ μ¬μ¬μ©
- EU λ°μ΄ν° λ μ§λμ: μ λ½ κΈ°λ° μ ν리μΌμ΄μ μ μν μμ ν μ§μ
- ν₯μλ 컨ν μ€νΈ κ΄λ¦¬: ν ν° μ ν μ€μ λ° λ€μ€ ν΄ λν μ λ¨ κΈ°λ₯
μ€μ νμ© μ¬λ‘: T-Mobileμ νμ μ μΈ κ³ κ° μλΉμ€
κΈ°μ ꡬν μ¬λ‘ λΆμ
T-Mobileμ GPT-Realtimeμ νμ©νμ¬ λλ°μ΄μ€ μ
κ·Έλ μ΄λ νλ‘μΈμ€λ₯Ό νμ μ μΌλ‘ κ°μ νμ΅λλ€.
μ΄λ€μ μ κ·Ό λ°©μμ λ€μκ³Ό κ°μ ν΅μ¬ μ² νμ λ°μν©λλ€:
Shini Gopalan (T-Mobile COO)μ ν΅μ°°:
AIλ₯Ό μ¬μ©ν΄ 10% λ λμ IVRμ ꡬμΆνλ €κ³ νλ©΄ AIμ λν μ¬κ³ κ° μλͺ»λ κ²μ λλ€.
μ΄ κΈ°μ μ μ¬μ©ν΄ κΈ°μ‘΄ νλ‘μΈμ€λ₯Ό μμ ν νκ΄΄νκ³ μ²μλΆν° λ€μ ꡬμΆν΄μΌ ν©λλ€.
μ€μ λν μλ리μ€
λ€μμ T-Mobileμ GPT-Realtime κΈ°λ° κ³ κ° μλΉμ€ λ°λͺ¨μ λλ€:
Original Conversation:
1
2
3
4
5
6
7
8
9
10
11
Customer: "Yeah, my daughter Rachel dropped her phone in the lake and I just need a new one. Stat."
AI: "Oh, no. I'm sorry that happened. Let's make sure we get a solid replacement quickly. Are you looking for something with stronger water resistance?"
Customer: "Honestly, I'm just looking for something cheap, something under $300."
AI: "Got it. Let me show you some options under $300..."
Customer: "Yeah, this Revel 8 phone from T-Mobile, is that compatible with T-Mobile satellite services?"
AI: "The Revel 8 phone is compatible with T-Mobile satellite services. It currently supports text messaging, including text to 911 and location sharing."
Korean Translation:
1
2
3
4
5
6
7
8
9
10
11
κ³ κ°: "λ€, μ λΈ Rachelμ΄ ν΄λν°μ νΈμμ λ¨μ΄λ¨λ €μ μ ν°μ΄ κΈν νμν΄μ."
AI: "μ, μλλ€μ. λΉ λ₯΄κ² κ²¬κ³ ν λ체νμ μ°Ύμλλ¦¬κ² μ΅λλ€. λ κ°ν λ°©μ κΈ°λ₯μ΄ μλ μ νμ μ°Ύκ³ κ³μ κ°μ?"
κ³ κ°: "μμ§ν μ λ ΄ν κ±Έ μ°Ύκ³ μμ΄μ. 300λ¬λ¬ λ―Έλ§μΌλ‘μ."
AI: "μκ² μ΅λλ€. 300λ¬λ¬ λ―Έλ§μ μ΅μ
λ€μ 보μ¬λλ¦¬κ² μ΅λλ€..."
κ³ κ°: "λ€, T-Mobileμ μ΄ Revel 8 ν°μ΄ T-Mobile μμ± μλΉμ€μ νΈνλλμ?"
AI: "Revel 8 ν°μ T-Mobile μμ± μλΉμ€μ νΈνλ©λλ€. νμ¬ 911 λ¬Έμ ν¬ν¨ν λ¬Έμ λ©μμ§κ³Ό μμΉ κ³΅μ λ₯Ό μ§μν©λλ€."
κΈ°μ λμ μ ν΅μ¬ μ±κ³΅ μμΈ
T-Mobile μ¬λ‘μμ λμΆν μ μλ μ£Όμ κ΅νλ€:
- νλ‘μΈμ€ μ¬μ€κ³: κΈ°μ‘΄ μμ€ν μ μ μ§μ κ°μ μ΄ μλ μμ ν μ¬κ΅¬μΆ
- λΈλλ μΌμΉμ±: AI ꡬνμ΄ νμ¬μ ν΅μ¬ κ°μΉμ λ¬Ένμ λΆν©
- κ³ κ° μ€μ¬ μ κ·Ό: 볡μ‘ν νλ‘μΈμ€λ₯Ό μμ°μ€λ¬μ΄ λνλ‘ λ¨μν
- Expert-in-Pocket: μΈμ μ΄λμλ μ λ¬Έκ° μμ€μ μλΉμ€ μ 곡
보μ λ° κ°μΈμ 보보νΈ
μμ μ₯μΉ λ° μν λ°©μ
Realtime APIλ μ€μ© λ°©μ§λ₯Ό μν λ€μΈ΅μ μμ μ₯μΉλ₯Ό ꡬνν©λλ€:
- μ€μκ° λΆλ₯κΈ°: API μΈμ μμ μ ν΄ν μ½ν μΈ κ°μ΄λλΌμΈ μλ° μ λν μ€λ¨
- ν리μ μμ±: μ μμ μΈ μ¬μ©μμ νμΈ μ¬μΉ λ°©μ§
- κ°λ°μ μμ κ°μ΄λλΌμΈ: Agents SDKλ₯Ό ν΅ν μΆκ°μ μΈ μμ μ₯μΉ κ΅¬ν κ°λ₯
κ°μΈμ λ³΄λ³΄νΈ μ μ±
- EU λ°μ΄ν° λ μ§λμ: μ λ½ κΈ°λ° μ ν리μΌμ΄μ μ μν μμ ν μ§μ
- κΈ°μ κ°μΈμ λ³΄λ³΄νΈ μ½μ: μν°νλΌμ΄μ¦κΈ κ°μΈμ λ³΄λ³΄νΈ λ³΄μ₯
- μ¬μ© μ μ± : μ€νΈ, κΈ°λ§, κΈ°ν μ ν΄ λͺ©μ μΌλ‘μ μΆλ ₯ μ¬λͺ©μ ν λλ λ°°ν¬ κΈμ§
- AI μνΈμμ© λͺ μ: μ¬μ©μκ° AIμ μνΈμμ©νκ³ μμμ λͺ νν νμν΄μΌ ν¨
κ°κ²© μ μ± λ° λΉμ© μ΅μ ν
μλ‘μ΄ κ°κ²© ꡬ쑰
GPT-Realtimeμ κΈ°μ‘΄ λλΉ 20% κ°κ²© μΈνλ₯Ό μ 곡ν©λλ€:
νλͺ© | κ°κ²© |
---|---|
μ€λμ€ μ λ ₯ ν ν° | $32 / 1M ν ν° |
μΊμλ μ λ ₯ ν ν° | $0.40 / 1M ν ν° |
μ€λμ€ μΆλ ₯ ν ν° | $64 / 1M ν ν° |
GPT-Realtimeμ κ°κ²© λͺ¨λΈμμ μ€λμ€λ μ΄λΉ 24ν ν°μΌλ‘ κ³μ°λλ―λ‘, κΈ΄ λνμμλ ν ν° μ¬μ©λμ΄ κΈκ²©ν μ¦κ°ν μ μμ΅λλ€.
μ€μ μλΉμ€μμλ μ€μλλ κ°μ μ λ§₯λ½μ λ°λΌ νΉμ λν ν΄μ μ°μ μ μΌλ‘ 보쑴νλ λ μ κ΅ν μκ³ λ¦¬μ¦μ ꡬνν μ μμ΅λλ€.
μ€μ νλ‘μ νΈ κ°μ΄λ
μλλ ν΄λΉ APIλ₯Ό μ¬μ©ν μ μλ λͺκ°μ§ μ€μ νλ‘μ νΈμ λλ€.
νλ‘μ νΈ 1: κ³ κ° μ§μ λ΄ κ΅¬μΆ
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
def create_customer_support_bot():
"""κ³ κ° μ§μ λ΄ μμ± ν¨μ"""
system_prompt = """
λΉμ μ TechCorpμ μ λ¬Έ κ³ κ° μ§μ μλ΄μμ
λλ€.
κ°μ΄λλΌμΈ:
- νμ μ μ€νκ³ κ³΅κ°μ μΌλ‘ μλνμΈμ
- λ¬Έμ λ₯Ό λ¨κ³λ³λ‘ ν΄κ²°νμΈμ
- 볡μ‘ν μ΄μλ μΈκ° μλ΄μμκ² μμ€μ»¬λ μ΄μ
νμΈμ
- μΉμΈ μμ΄λ 50λ¬λ¬λ₯Ό μ΄κ³Όνλ νλΆμ μ½μνμ§ λ§μΈμ
"""
tools = [
{
"type": "function", # ν¨μ νμ
"function": {
"name": "check_order_status", # μ£Όλ¬Έ μν νμΈ
"description": "Check customer order status", # κ³ κ° μ£Όλ¬Έ μν νμΈ
"parameters": {
"type": "object",
"properties": {
"order_id": {"type": "string"} # μ£Όλ¬Έ ID
},
"required": ["order_id"] # νμ λ§€κ°λ³μ
}
}
}
]
return {
"system_prompt": system_prompt, # μμ€ν
ν둬ννΈ
"tools": tools, # μ¬μ© λꡬλ€
"voice": "marin", # μμ± μ ν
"response_format": {"type": "audio"} # μ€λμ€ μλ΅ νμ
}
μ΄ κ³ κ° μ§μ λ΄ μμ λ μ€μ λΉμ¦λμ€ νκ²½μμ μ€μν μμΉλ€μ λ°μν©λλ€.
μμ€ν ν둬ννΈμμ νλΆ νλλ₯Ό λͺ μν κ²μ GPT-Realtimeμ λ°μ΄λ λͺ λ Ή μ€μ λ₯λ ₯μ νμ©ν κ²μΌλ‘, T-Mobile λ°λͺ¨μμ 보μ¬μ€ κ²μ²λΌ λͺ¨λΈμ΄ μ μ± μ μ νν λ°λ₯΄λλ‘ λ³΄μ₯ν©λλ€.
μ€μ ꡬν μμλ μ£Όλ¬Έ μ‘°ν μΈμλ λ°ν μ²λ¦¬, κΈ°μ μ§μ, FAQ κ²μ λ± λ€μν λꡬλ₯Ό μΆκ°ν μ μμ΅λλ€.
νλ‘μ νΈ 2: κ΅μ‘μ© AI νν°
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
class AITutor:
"""AI νν° ν΄λμ€"""
def __init__(self, subject="mathematics"):
self.subject = subject # κ³Όλͺ©
self.student_progress = {} # νμ μ§λ μΆμ
def create_tutoring_session(self, student_level):
"""νν°λ§ μΈμ
μμ±"""
system_prompt = f"""
λΉμ μ {self.subject} μ λ¬Έ νν°μ
λλ€.
νμ μμ€: {student_level}
κ΅μ‘ μ κ·Όλ²:
- μν¬λΌν
μ€μ λ°©λ² μ¬μ© - μ λ μ§λ¬ΈνκΈ°
- λ¨κ³λ³ μ€λͺ
μ 곡
- νμμ μ¬κ³ λ₯Ό κ²©λ €
- νμ μλ΅μ λ°λΌ λμ΄λ μ‘°μ
"""
return {
"system_prompt": system_prompt, # μμ€ν
ν둬ννΈ
"voice": "cedar", # κ΅μ‘μ λ μ ν©ν μμ±
"tools": self._get_educational_tools() # κ΅μ‘μ© λꡬλ€
}
def _get_educational_tools(self):
"""κ΅μ‘μ© λꡬ λ°ν"""
return [
{
"type": "function", # ν¨μ νμ
"function": {
"name": "generate_practice_problem", # μ°μ΅ λ¬Έμ μμ±
"description": "Generate practice problems", # μ°μ΅ λ¬Έμ μμ±
"parameters": {
"type": "object",
"properties": {
"difficulty": {"type": "string"}, # λμ΄λ
"topic": {"type": "string"} # μ£Όμ
}
}
}
}
]
κ΅μ‘μ© AI νν°λ GPT-Realtimeμ κ°μ ννκ³Ό μ€μκ° μ μ λ₯λ ₯μ μ΅λν νμ©νλ μ¬λ‘μ λλ€.
student_progress
λμ λ리λ κ°μΈνλ νμ΅ κ²½νμ μν΄ νμλ³ μ§λμ μ½μ μ μΆμ ν μ μλ νμ₯ κ°λ₯ν ꡬ쑰λ₯Ό μ 곡ν©λλ€.
μ€μ κ΅μ‘ μλΉμ€μμλ νμ΅ λΆμ, μ±κ³Ό νκ°, λΆλͺ¨ 리ν¬νΈ κΈ°λ₯ λ±μ μΆκ°λ‘ ꡬνν μ μμ΅λλ€.
ν₯ν λ°μ λ°©ν₯κ³Ό μ λ§
1. κΈ°μ μ νμ μμ
GPT-Realtimeμ λ±μ₯μ λ€μκ³Ό κ°μ κΈ°μ μ λ°μ μ μκ³ ν©λλ€:
- λ€μ€ μΈμ΄ λμ μ§μ: μ€μκ°μΌλ‘ μ¬λ¬ μΈμ΄λ₯Ό νΌμ©νλ κΈλ‘λ² λΉμ¦λμ€ νκ²½ μ§μ
- κ°μ μ§λ₯ ν₯μ: λ μ κ΅ν κ°μ μΈμ λ° νν λ₯λ ₯
- λλ©μΈ νΉν: μλ£, λ²λ₯ , κΈμ΅ λ± μ λ¬Έ λΆμΌλ³ μ΅μ ν λͺ¨λΈ
- μ€μκ° νμ΅: μ¬μ©μμμ μνΈμμ©μ ν΅ν κ°μΈν νμ΅
2. μ°μ λ³ μ μ© νμ°
ν¬μ€μΌμ΄
- νμ μλ΄ λ° μ§λ£ 보쑰
- μ μ κ±΄κ° μλ΄ λ΄
- μλ£μ§ κ΅μ‘ λꡬ
κ΅μ‘
- κ°μΈνλ μΈμ΄ νμ΅
- STEM κ³Όλͺ© νν°λ§
- νΉμ κ΅μ‘ μ§μ
κΈμ΅
- ν¬μ μλ΄ μλΉμ€
- 보ν ν΄λ μ μ²λ¦¬
- κΈμ΅ μν μλ΄
μν°ν μΈλ¨ΌνΈ
- μΈν°λν°λΈ μ€ν 리ν λ§
- κ²μ λ΄ NPC
- κ°μ μλ°ν μλΉμ€
3. μ€λ¦¬μ κ³ λ €μ¬ν
μμ± AI κΈ°μ μ λ°μ κ³Ό ν¨κ» κ³ λ €ν΄μΌ ν μ€λ¦¬μ μ΄μλ€:
- λ₯νμ΄ν¬ λ° μμ± λ³΅μ λ°©μ§
- μ¬μ©μ λμ λ° ν¬λͺ μ±
- νΈν₯μ± μν λ° κ³΅μ μ±
- λ°μ΄ν° 보μ λ° κ°μΈμ 보보νΈ
λ§λ¬΄λ¦¬
OpenAI GPT-Realtimeμ μΆμλ μμ± AI κΈ°μ μ μμ΄μ μ€μν μ νμ μ μλ―Έν©λλ€. μ ν΅μ μΈ λ€λ¨κ³ νμ΄νλΌμΈμ νκ³λ₯Ό 극볡νκ³ , μΈκ° μμ€μ μμ°μ€λ¬μ΄ λνκ° κ°λ₯ν Speech-to-Speech λͺ¨λΈμ λ€μν μ°μ λΆμΌμμ νμ μ μΈ λ³νλ₯Ό μ΄λμ΄λΌ κ²μΌλ‘ μμλ©λλ€.
νΉν T-Mobile μ¬λ‘μμ 보λ―μ΄, AIλ₯Ό λ¨μν κΈ°μ‘΄ νλ‘μΈμ€ κ°μ λκ΅¬λ‘ λ³΄λ κ²μ΄ μλλΌ μμ ν μλ‘μ΄ κ³ κ° κ²½νμ μ°½μ‘°νλ νλ«νΌμΌλ‘ μ κ·Όν λ μ§μ ν κ°μΉλ₯Ό μ€νν μ μμ΅λλ€. κ°λ°μλ€μ μ΄λ¬ν μλ‘μ΄ κ°λ₯μ±μ νμ©νμ¬ λμ± μ§κ΄μ μ΄κ³ ν¨κ³Όμ μΈ μμ± κΈ°λ° μ ν리μΌμ΄μ μ ꡬμΆν μ μκ² λμμ΅λλ€.
GPT-Realtimeκ³Ό Realtime APIμ μ μ μΆμλ‘ μμλ μ΄ μλ‘μ΄ μλμμ, μμ± AIλ λ¨μν κΈ°μ μ λꡬλ₯Ό λμ΄ μΈκ°κ³Ό κΈ°κ³ κ°μ μν΅ λ°©μμ κ·Όλ³Έμ μΌλ‘ λ³νμν€λ μ΄λ§€μ μν μ ν κ²μ λλ€. ν₯ν μ΄ κΈ°μ μ΄ μ΄λ»κ² λ°μ νκ³ μ°λ¦¬μ μΌμκ³Ό μ 무μ μ΄λ€ λ³νλ₯Ό κ°μ Έμ¬μ§ κΈ°λν΄λ΄ λλ€.
μ€λλ μ½μ΄μ£Όμ μ κ°μ¬ν©λλ€ π