[OpenAI] Introduction to Operator & Agents : Computer-Using Agent
μλ³Έ κ²μκΈ: https://velog.io/@euisuk-chung/OpenAI-Introduction-to-Operator-Agents-Computer-Using-Agent
What is Computer-Using Agent (CUA)?
π μ°Έκ³ μλ£ : OpenAI blog
- Computer-Using Agent (CUA): https://openai.com/index/computer-using-agent/
- Operator : https://openai.com/index/introducing-operator/
Youtube μκ° μμ: Introduction to Operator & Agents
Computer-Using Agent(CUA)λ OpenAIμμ μλ‘κ² μΆμν μμ΄μ νΈλ‘, μ¬λμ²λΌ μ»΄ν¨ν°λ₯Ό μ‘°μν μ μλ κΈ°λ₯μ μ 곡ν©λλ€.
- CUAλ κ·Έλν½ μ¬μ©μ μΈν°νμ΄μ€(GUI)λ₯Ό μ§μ μ‘°μνλ©°, λ²νΌ ν΄λ¦, μ€ν¬λ‘€, ν
μ€νΈ μ
λ ₯ λ±μ μμ
μ μνν μ μμ΅λλ€.
- μ΄λ¬ν μ κ·Ό λ°©μμ κΈ°μ‘΄μ OS- λλ μΉ-νΉν API μμ΄λ λ€μν λμ§νΈ νκ²½μμ μ μ°νκ² μμ μ μ²λ¦¬ν μ μλλ‘ λ§λ€μ΄μ€λλ€.
- νΉν, μ΄ λͺ¨λΈμ GPT-4oμ λΉμ (vision) κΈ°λ₯κ³Ό κ°ννμ΅ κΈ°λ°μ κ³ λνλ μΆλ‘ λ₯λ ₯μ κ²°ν©νμ¬ κ°λ ₯ν μ±λ₯μ λ°νν©λλ€.
CUAλ λ¨μν μμ μμλΆν° 볡μ‘ν λ€λ¨κ³ μμ κΉμ§ μ²λ¦¬ν μ μλ λ²μ©μ±μ μλν©λλ€.
- κΈ°μ‘΄μ AI μμ€ν μ΄ νΉμ ν APIμ μμ‘΄ν΄ νμ μ μΈ μμ λ§ μνν μ μμλ€λ©΄, CUAλ μΈκ°μ΄ μ»΄ν¨ν°λ₯Ό λ€λ£¨λ λ°©μ κ·Έλλ‘ μμ μ μννλ©° λμ§νΈ μΈκ³μμ μλ‘μ΄ κ°λ₯μ±μ μ΄μ΄μ€λλ€.
- μ΄λ‘μ¨ μ¬μ©μλ λ¨μν λͺ λ Ήλ§ μ λ¬νκ³ , λλ¨Έμ§ μμ μ CUAκ° ν¨μ¨μ μΌλ‘ μ²λ¦¬ν μ μλλ‘ ν©λλ€.
νΉν, Operatorμ ν¨κ» μ 곡λ¨μΌλ‘μ¨, βCUAλ λ¨μν μλν λꡬλ₯Ό λμ΄μλ βλμ§νΈ μ‘°μ(digital agent)βλ‘ μ리 μ‘μ κ²βμ΄λΌκ³ μ€λͺ ν©λλ€.
- Operatorλ CUAμ κ°λ ₯ν κΈ°λ₯μ μ¬μ©μκ° λμ± νΈλ¦¬νκ² νμ©ν μ μλλ‘ λλ μμ€ν μΌλ‘, μ¬μ©μ μΉνμ μΈ μΈν°νμ΄μ€μ λ€μν μμ μ₯μΉλ₯Ό ν΅ν΄ CUAμ μ μ¬λ ₯μ κ·Ήλνν©λλ€.
- Operatorλ μ¬μ©μκ° μ£Όμ΄μ§ μμ μ μ ννκ³ μ μνκ² μ²λ¦¬ν μ μλλ‘ μ§μνλ©°, μ€μκ°μΌλ‘ μνΈμμ©νλ©° μμ μ ν¬λͺ μ±κ³Ό μ λ’°μ±μ 보μ₯ν©λλ€.
Operator νλ©΄ (μΆμ²: https://operator.chatgpt.com/)
κ°μΈμ μΌλ‘ Computer-Using Agent (CUA)
μ Operator
μ μ μκ° λͺ¨νΈν κ² κ°μμ νλ² μ 리ν΄λ³΄μμ΅λλ€:
- CUAλ Operatorμ ν΅μ¬ κΈ°μ μ κΈ°λ°μ΄λ©°, GUI μ‘°μμ μ€μ¬μΌλ‘ νλ λ²μ© μμ΄μ νΈμ λλ€.
- λ°λ©΄, Operatorλ μ΄λ₯Ό μ€μ©μ μ΄κ³ μ¬μ©μκ° μ½κ² μ κ·Όν μ μλλ‘ λ§λ μμ λ 벨 μμ΄μ νΈλ‘, μ¬μ©μ κ²½νμ μ€μ μ λ μλΉμ€μ
λλ€.
- Operatorλ CUAμ λ₯λ ₯μ ν΅ν΄ λμ§νΈ μμ μ ν¨μ¨μ μΌλ‘ μννλ©°, νΉν μΌμμ μΈ μμ μ μλννκ³ λ¨μννλ λ° μ΄μ μ λ§μΆ₯λλ€.
κ°κ° Computer-Using Agent (CUA)
μ Operator
μ κ°λ
μ μ’ λ λ©΄λ°νκ² νμ
ν΄λ³΄κ² μ΅λλ€.
π» Computer-Using Agent (CUA)
- μ μ:
- Computer-Using Agent(CUA)λ βκ·Έλν½ μ¬μ©μ μΈν°νμ΄μ€(GUI)λ₯Ό μ§μ μ‘°μν μ μλλ‘ μ€κ³λ AI μμ΄μ νΈβμ λλ€.
- νλ©΄μ ν½μ λ°μ΄ν°λ₯Ό μ΄ν΄νκ³ , λ§μ°μ€ ν΄λ¦, ν€λ³΄λ μ λ ₯, μ€ν¬λ‘€ λ± μ¬μ©μκ° νλ©΄κ³Ό μνΈμμ©νλ λ°©μ κ·Έλλ‘ μμ μ μνν©λλ€.
- μ£Όμ νΉμ§:
- μκ° λ° μνΈμμ© λ₯λ ₯: CUAλ νλ©΄μ βλ³΄κ³ β μ΄ν΄νλ©°, μ΄λ₯Ό λ°νμΌλ‘ μμ μ μνν©λλ€.
- κ°ννμ΅ κΈ°λ°: κ³ κΈ μΆλ‘ λ₯λ ₯κ³Ό Chain-of-Thought λ°©μμ νμ©νμ¬ λ³΅μ‘ν μμ νλ¦λ μ²λ¦¬ν μ μμ΅λλ€.
- λ 립μ μμ μν: APIμ μμ‘΄νμ§ μκ³ , μΈκ°μ²λΌ λμ§νΈ μΈν°νμ΄μ€λ₯Ό λ€λ£° μ μμ΅λλ€.
- μ¬μ© λ²μ:
- CUAλ νΉμ νλ«νΌμ μ νλμ§ μκ³ , μΌλ°μ μΈ λμ§νΈ νκ²½μμ λ€μνκ² νμ©λ©λλ€.
- μλ₯Ό λ€μ΄, μΉ κ²μ, λ°μ΄ν° μ λ ₯, νλ©΄ μνΈμμ© λ±μ ν΅ν΄ μΈκ°μ μμ μ λ체νκ±°λ 보μν©λλ€.
βοΈ Operator
- μ μ:
- Operatorλ CUAμ κΈ°λ₯μ μ¬μ©μ μΉνμ μΌλ‘ ꡬνν OpenAIμ μμ λ 벨 μμ΄μ νΈμ λλ€.
- Operatorλ μ¬μ©μμ μ§μ μνΈμμ©νλ©°, μμ°μ΄ λͺ λ Ήμ ν΅ν΄ CUAμ μμ μ μ‘°μ¨νκ³ κ²°κ³Όλ₯Ό μ 곡ν©λλ€.
- μ£Όμ νΉμ§:
- μ§κ΄μ μΈ μΈν°νμ΄μ€: μ¬μ©μλ μμ°μ΄λ‘ μμ μ μμ²νλ©°, Operatorλ μ΄λ₯Ό ν΄μν΄ CUAκ° μ€νν μ μλλ‘ μ²λ¦¬ν©λλ€.
- μμ λ° μ μ΄: λ―Όκ°ν μμ (μ: λ‘κ·ΈμΈ, κ²°μ )μμλ μ¬μ©μ κ°μ μ μμ²ν΄ μμ μ μ λ’°μ±μ 보μ₯ν©λλ€.
- κ°μΈν κ°λ₯: νΉμ μΉμ¬μ΄νΈλ μμ μ λ§λ λ§μΆ€ν μ§μλ₯Ό μ μ₯ν΄ λ°λ³΅ μμ μ ν¨μ¨μ±μ λμ λλ€.
- λ°λͺ¨ λ° νμ₯μ±: μ¬μ©μ μν¬νλ‘μ°λ₯Ό μ΅μ νν μ μλλ‘ μ€κ³λμμΌλ©°, APIλ₯Ό ν΅ν΄ ν μμ€ν κ³Ό ν΅ν© κ°λ₯ν©λλ€.
- μ¬μ© μ¬λ‘:
- Operatorλ CUAλ₯Ό κΈ°λ°μΌλ‘, μ¬μ©μκ° νμλ‘ νλ μμ μ μ§κ΄μ μΌλ‘ μ²λ¦¬νλ©°, 볡μ‘ν νλ‘μΈμ€λ κ°λ¨ν λͺ λ ΉμΌλ‘ ν΄κ²°ν©λλ€.
- μ: νΈν μμ½, μΌν, λ°μ΄ν° μ λ ₯, μμ μλν λ±.
μ°¨μ΄μ
κ΅¬λΆ | Computer-Using Agent (CUA) | Operator |
---|---|---|
μ£Όμ μν | GUIλ₯Ό μ‘°μνλ©° μμ μ μννλ AI μμ€ν | μ¬μ©μμ μνΈμμ©νλ©°, CUAμ κΈ°λ₯μ νμ©ν΄ μμ μ κ΄λ¦¬νκ³ μ²λ¦¬ |
μ κ·Ό λ°©μ | κ°ννμ΅ κΈ°λ°μ μΆλ‘ λ₯λ ₯μ ν΅ν΄ λ 립μ μΌλ‘ μμ μν | μ¬μ©μ μΉνμ μΈν°νμ΄μ€λ‘ μμ μμ²μ μ²λ¦¬νκ³ κ²°κ³Όλ₯Ό μ 곡 |
μ¬μ© λ²μ | νΉμ μμ μν보λ€λ λ²μ©μ μΈ μμ΄μ νΈ νλ μμν¬ μ 곡 | μΉ λΈλΌμ°μ λ° GUI μμ ꡬ체μ μμ μ μ€μκ°μΌλ‘ μ²λ¦¬ |
μμ μ₯μΉ | λ΄λΆμ μΈ μΆλ‘ κ³Όμ μ ν΅ν΄ μμ μ μ ν©μ±μ νλ¨ | μ¬μ©μ κ°μ μ μμ²νκ±°λ, μμ μΉμΈ μμ²μ ν΅ν΄ λ―Όκ°ν μ 보 λ³΄νΈ |
μ μ© μ¬λ‘ | μ°κ΅¬ κ°λ° λ° API ν΅ν©μ ν΅ν κ³ κΈ μμ΄μ νΈ κ΅¬ν | μΉ κΈ°λ° μλν μμ (νΈν μμ½, μΌν 리μ€νΈ κ΄λ¦¬, 곡곡 μλΉμ€ μ΄μ© λ±) |
νμ₯μ± | APIλ₯Ό ν΅ν΄ λ€μν κ°λ°μ λ° μμ€ν μ ν΅ν© κ°λ₯ | μ¬μ©μ λ§μΆ€ν μ€μ λ° λ€μ€ μμ κ΄λ¦¬ κΈ°λ₯ μ 곡 |
How it works
CUAλ νλ©΄μ ν½μ λ°μ΄ν°λ₯Ό μ΄ν΄νκ³ κ°μ λ§μ°μ€μ ν€λ³΄λλ₯Ό μ¬μ©ν΄ μμ μ μνν©λλ€.
CUA Diagram (μΆμ²: https://openai.com/index/computer-using-agent/)
-
μ¬μ©μκ° μμ μ μμ²νλ©΄ CUAλ λ€μκ³Ό κ°μ λ°λ³΅μ μΈ λ£¨νλ₯Ό ν΅ν΄ μ΄λ₯Ό μνν©λλ€:
-
Perception (μ§κ°):
- νμ¬ νλ©΄μ μ€ν¬λ¦°μ·μ λΆμνμ¬ μ»΄ν¨ν° μνλ₯Ό μ΄ν΄ν©λλ€.
-
μ΄ κ³Όμ μμ νλ©΄μ λνλ ν μ€νΈμ μ΄λ―Έμ§λ₯Ό λΆμν΄ νμ¬ μνλ₯Ό μ νν νμ ν©λλ€.
-
Reasoning (μΆλ‘ ):
- Chain-of-Thought λ°©μμ μ¬μ©νμ¬ νμ¬μ μ΄μ μμ μνλ₯Ό κ³ λ €νλ©° λ€μμ μνν λ¨κ³λ₯Ό κ³νν©λλ€.
-
μ΄λ, λ΄λΆμ μΌλ‘ μν λ¨κ³λ₯Ό μΈλΆννμ¬ μ΅μ μ ν΄κ²° λ°©μμ μ°Ύμλ λλ€.
-
Action (νλ):
-
λ§μ°μ€ ν΄λ¦, μ€ν¬λ‘€, ν μ€νΈ μ λ ₯ λ±μ μμ μ μ€ννλ©°, νμμ μ¬μ©μ νμΈμ μμ²ν©λλ€.
-
μΆκ°μ μΌλ‘ λ‘κ·ΈμΈ μ 보 μ λ ₯μ΄λ CAPTCHA νμΈ κ°μ λ―Όκ°ν μμ μλ μ¬μ©μμ νμΈμ λ°μ΅λλ€.
-
-
CUAλ μ΄λ¬ν κ³Όμ μ ν΅ν΄ 볡μ‘ν λ¬Έμ λ₯Ό 체κ³μ μΌλ‘ ν΄κ²°νλ©°, Operatorλ μ΄λ¬ν CUAμ μλ λ°©μμ μ§κ΄μ μΌλ‘ νμ©ν μ μλλ‘ μ§μν©λλ€:
- μλ₯Ό λ€μ΄, λΈλΌμ°μ λ΄μμ λ°μ΄ν°λ₯Ό κ²μνκ³ μ
λ ₯νκ±°λ, μ¬λ¬ λ¨κ³λ₯Ό κ±°μ³ λͺ©νλ₯Ό λ¬μ±νλ λ± λ€μν μμ
μλ리μ€μμ νμν μ±λ₯μ λ°νν©λλ€.
- λν, μμ μ€ λ°μνλ μ€λ₯λ₯Ό μ€μ€λ‘ μμ νλ©° μ μμ μΌλ‘ νλν©λλ€.
μλλ Operatorμμ λͺκ°μ§ usage scenarioλ€μ μ μν΄μ sampleλ‘ λ³΄μ¬μ£Όκ³ μλ κ²μ νμΈν μ μλ κ·Έλ¦Όμ λλ€.
μΉμμ μνν μ μλ μ¬λ§ν κΈ°λ₯λ€μ Operatorλ₯Ό ν΅ν΄ μμ μ μνν΄λ³Ό μ μλ κ²μ νμΈν μ μμ΅λλ€. (ex. μ£Όλ¬Έ, μμ½, μΌν λ±)
- μ¬μ©μλ Operatorλ₯Ό ν΅ν΄ λ¨μν μμ°μ΄λ‘ μμ μ μ§μν μ μμΌλ©°, CUAλ ν΄λΉ μ§μμ λ°λΌ νμν μμ μ μνν©λλ€.
-
Operatorλ μμ μ§ν μν©μ μκ°μ μΌλ‘ νμνλ©°, μ¬μ©μκ° νμμ κ°μ νμ¬ μμ μ μ‘°μ ν μ μλλ‘ λμ΅λλ€.
- μλ₯Ό λ€μ΄, μ¬μ©μλ νΉμ μμ λ¨κ³μμ μ§μ 컨νΈλ‘€μ λ겨λ°μ μμ μ μμ νκ±°λ, CUAκ° μ μν κ²°κ³Όλ₯Ό νμΈνκ³ μΉμΈμ λ΄λ¦΄ μ μμ΅λλ€.
Agentμ Operatorμ κ°λ νμ₯
Agentλ λ¨μν μ£Όμ΄μ§ λͺ λ Ήμ μ€ννλ λꡬλ₯Ό λμ΄, μ¬μ©μκ° λͺ©νλ₯Ό μ€μ νλ©΄ ν΄λΉ λͺ©νλ₯Ό λ¬μ±νκΈ° μν λͺ¨λ μΈλΆ λ¨κ³λ₯Ό μ€μ€λ‘ κ³ννκ³ μ€ννλ AI μμ€ν μ μλ―Έν©λλ€. μ΄λ μΈκ°μ μ‘°λ ₯μ μ΅μννλ©΄μλ μ νμ±κ³Ό ν¨μ¨μ±μ κ·Ήλνν©λλ€.
Operatorλ μ΄λ¬ν Agent μ€μμλ νΉν μΉ λΈλΌμ°μ λ₯Ό νμ©ν μμ μ μ λ¬ΈμΌλ‘ νλ©°, μ¬μ©μκ° μνΈμμ©νλ κ·Έλν½ μΈν°νμ΄μ€λ₯Ό μ§μ λ€λ£¨λ μ μμ κΈ°μ‘΄μ AIμ μ°¨λ³νλ©λλ€. μ΄λ‘ μΈν΄ APIλ μ ν΄μ§ νλ‘ν μ½ μμ΄λ λλΆλΆμ λμ§νΈ νκ²½μμ μμ μ΄ κ°λ₯ν©λλ€.
Operatorμ μ£Όμ νΉμ§μ λ€μκ³Ό κ°μ΅λλ€:
-
μμ¨μ±:
- Operatorλ λ¨μν μ¬μ©μμ λͺ λ Ήμ λ°μ μννλ κ²μ λμ΄, μμ μ€ λ°μνλ λ¬Έμ λ₯Ό μ€μ€λ‘ ν΄κ²°νκ±°λ λ체 λ°©μμ μ μν©λλ€.
- μλ₯Ό λ€μ΄, μ¬μ©μκ° μμ½μ μμ²νμΌλ μνλ μκ°μ΄ λΆκ°λ₯ν κ²½μ°, μλμΌλ‘ λ체 μκ°μ μ°Ύμ μ μν©λλ€.
-
μ μ°μ±:
- Operatorλ νΉμ μΉμ¬μ΄νΈλ μννΈμ¨μ΄μ νμ λμ§ μκ³ , λͺ¨λ λΈλΌμ°μ κΈ°λ° μμ μμ νμ© κ°λ₯νλ€λ μ μμ λμ μ μ°μ±μ μ 곡ν©λλ€.
-
νμ₯ κ°λ₯μ±:
- Operatorλ ν₯ν APIλ₯Ό ν΅ν΄ λ€μν μΈλΆ μ ν리μΌμ΄μ κ³Ό ν΅ν©λ μ μμΌλ©°, κ°λ°μκ° μμ μ μν¬νλ‘μ°μ λ§κ² 컀μ€ν°λ§μ΄μ§ν μ μλ νκ²½μ μ 곡ν©λλ€.
Agentμ Operatorλ μ¬μ©μμ λμ§νΈ κ²½νμ νμΈ΅ λ ν₯μμν€κΈ° μν λκ΅¬λ‘ μ€κ³λμμ΅λλ€.
- Operatorλ λ¨μν μλνλ₯Ό λμ΄ λμ§νΈ μνκ³μ μλ‘μ΄ ννμ μνΈμμ© λ°©μμ λμ ν©λλ€.
- κ³ κ° μ§μ, μ μμκ±°λ, 곡곡 μλΉμ€ λ± λ€μν λΆμΌμμ Operatorλ μΈκ°μ μ‘°λ ₯μλ‘μ μκ°κ³Ό μμμ μ μ½ν©λλ€.
- λν, 곡곡기κ΄κ³Ό κΈ°μ μ΄ μλ―Ό μ°Έμ¬μ κ³ κ° κ²½νμ κ°μ νλ λ° κΈ°μ¬ν μ μμ΅λλ€.
Operatorμ νμ© μ¬λ‘ (Demo)
Operatorλ μ€μ νμ© μ¬λ‘λ₯Ό ν΅ν΄ λ€μν μμ μμ AIμ ν¨μ¨μ±κ³Ό μ νμ±μ μ μ¦νμ΅λλ€.
μ°Έκ³ μμ λ§ν¬:
μλλ λ°λͺ¨ μμμμ μκ°λ μ£Όμ μ¬λ‘λ€μ λλ€:
-
Custom Instructions νμ©
- μ¬μ©μλ νΉμ μΉμ¬μ΄νΈμ λν λ§μΆ€ν μ€μ μ μΆκ°ν μ μμ΅λλ€.
- μλ₯Ό λ€μ΄, Pricelineμμ μ¬ν μμ½ μ βνλΆ κ°λ₯ν μκΈβκ³Ό βμ‘°μ ν¬ν¨β μ΅μ μ μ νΈνλλ‘ μ€μ ν μ μμ΅λλ€.
- μ΄ν λμΌν μμ μμ² μ Operatorλ μ΄λ¬ν μ¬μ©μ μ€μ μ μλμΌλ‘ λ°μν©λλ€.
- μ¬μ©μλ νΉμ μΉμ¬μ΄νΈμ λν λ§μΆ€ν μ€μ μ μΆκ°ν μ μμ΅λλ€.
-
Instacartλ₯Ό μ΄μ©ν μ₯보기
-
μ¬μ©μκ° νΉμ λ μνΌλ₯Ό μμ²νλ©΄, Operatorλ ν΄λΉ λ μνΌλ₯Ό κ²μν ν νμν μ¬λ£λ₯Ό Instacart μ₯λ°κ΅¬λμ μΆκ°ν©λλ€.
- μ¬μ©μλ μ μΈν νλͺ©μ 미리 λͺ μν μλ μμΌλ©°, μμ μ€κ°μ Operatorκ° νμΈμ μμ²ν©λλ€.
-
λν Take Controlμ΄λΌλ κΈ°λ₯μ ν΅ν΄, μ¬μ©μλ μμ μ μ€μν μκ°μ μ§μ κ°μ νμ¬ λ―Όκ°ν μ 보λ₯Ό μ λ ₯νκ±°λ μΈλΆμ¬νμ μμ ν μ μμ΅λλ€. ν΄λΉ λ°λͺ¨μμλ μ ν μλ μΆκ°νλ κ²μ μμ°μΌλ‘ 보μ¬μ€λλ€. (+adding eggs)
-
μΆκ°μ μΌλ‘ Take Control μμλ μ€μ λΈλΌμ°μ μμ μ¬λμ΄ κ²μ/μ λ ₯νλ λ°©μμ²λΌ μ¬μ©λ©λλ€.
- μλ₯Ό λ€μ΄, μ¬μ©μκ° Instacartμ λ‘κ·ΈμΈνκ±°λ κ²°μ μ 보λ₯Ό μ λ ₯ν΄μΌ νλ κ²½μ°, μ°λ¦¬κ° μ§μ μ λ ₯ ν μλ£νλ€κ³ μ λ¬ν΄μ£Όλ λ°©μμΌλ‘λ μ΄μ©μ΄ κ°λ₯ν©λλ€.
- μ΄λ₯Ό ν΅ν΄ μ¬μ©μλ μμ μ 보μμ±κ³Ό μ λ’°μ±μ μ μ§νλ©΄μλ, Operatorμ μλν κΈ°λ₯μ μ΅λν νμ©ν μ μμ΅λλ€.
-
-
OpenTableλ‘ μμ½νκΈ°
- Operatorλ μ¬μ©μκ° μ νΈνλ μμ μ νκ³Ό λ μ€ν λμ κΈ°λ°μΌλ‘ μμ½μ μ§νν©λλ€. μμ½ κ°λ₯ν μκ°λλ₯Ό μ¬μ©μμ μνΈμμ©νλ©° μ μνκ³ , μ΅μ’ νμΈ ν μμ½μ μλ£ν©λλ€.
- Demo μμΈ λΆμ:
-
Prompt
: Book me a table for 2 person at Beretta tonight at 7PM. -
ν΄λΌμ°λ λ²μΈμΌ νκ²½μμ AIκ° μ§μ μ‘°μ μ€, μΉ κ²μ λ° μμ½μ μννλ κ²μ λ³Ό μ μμ΅λλ€.
-
μ£Όμμ κ²½μ° Custom Instructionsμ 미리 μ§μ ν΄λ μΌλ‘μ¨ AIκ° μ΄λμ μ¬λμ§κΉμ§ νμ ν, μμΉμ λ§λ κ·Όμ² μμμ μΌλ‘ κ²μ/μμ½μ μνν μ μλλ‘ ν©λλ€.
-
Human Interactionμ΄ νμν κ²½μ°, μλ κ·Έλ¦Όκ³Ό κ°μ΄ μμ¬κ²°μ μ μμ²νλ κ²μ λ³Ό μ μμ΅λλ€.
-
Confirmation
μμ μ μ νμΈμ μμ²νκ³ , μ΄λ₯Ό μλ½ νΉμ κ±°μ ν μ μμ΅λλ€.
-
- λ©ν°ν
μ€νΉ κ°λ₯
- Operatorλ λμμ μ¬λ¬ μμ
μ μνν μ μλ κΈ°λ₯μ μ§μν©λλ€.
- μλ₯Ό λ€μ΄, νμͺ½ νμμλ λꡬ κ²½κΈ° μμ½ μμ μ μ§ννλ©΄μ λ€λ₯Έ νμμλ νΌμ μ£Όλ¬Έμ μ§νν μ μμ΅λλ€.
- μ΄λ Operatorμ κ°λ ₯ν μμ
λΆν λ° λμ μ²λ¦¬ λ₯λ ₯μ 보μ¬μ£Όλ μ¬λ‘μ
λλ€.
- λ°λͺ¨μμ νμΈλ μ΄ κΈ°λ₯μ Operatorκ° λ¨μν λ°λ³΅μ μΈ μμ μ μ²λ¦¬νλ κ²μ λμ΄ λ³΅μ‘ν λ©ν°νμ€νΉ μλ리μ€λ₯Ό μ§μν μ μμμ 보μ¬μ€λλ€.
- Operatorλ λμμ μ¬λ¬ μμ
μ μνν μ μλ κΈ°λ₯μ μ§μν©λλ€.
- Save Prompts κΈ°λ₯
-
βSaved Promptsβλ μ¬μ©μκ° λ°λ³΅μ μΌλ‘ μννλ μμ μ 미리 μ μνκ³ μ μ₯νμ¬ μ΄ν μμ½κ² μ¬μ¬μ©ν μ μλλ‘ λλ κΈ°λ₯μ λλ€.
- μλ₯Ό λ€μ΄ μ¬μ©μκ° κΈμμΌ μ λ
μ μμ£Ό νΉμ λ μ€ν λμμ μ λ
μμ¬λ₯Ό μμ½νλ€κ³ κ°μ ν΄ λ³΄κ² μ΅λλ€. μ΄ μμ
μ Saved Promptsμ μ μ₯νλ©΄, μ¬μ©μλ λ§€λ² λμΌν κ³Όμ μ λ°λ³΅νμ§ μκ³ , μ μ₯λ μμ
μ ν΄λ¦νμ¬ λ°λ‘ μ€νν μ μμ΅λλ€.
- (1) OpenTableμ νμ©ν΄ μμ½μ μ μ₯ν΄ λλ©΄, Operatorλ λ€μ λ²μ μμ½ν λ μ μ₯λ μ 보λ₯Ό μλμΌλ‘ λΆλ¬μ μ€νν©λλ€.
- (2) βμ€μ λ μ€ν λ μμ½βκ³Ό κ°μ κ°λ¨ν λͺ λ Ήμ΄λ₯Ό μ λ ₯νκΈ°λ§ νλ©΄, Operatorκ° μλμΌλ‘ μ νΈ λ μ€ν λ, μμ½ μκ°λ, μΈμ μ λ±μ κΈ°λ°μΌλ‘ μμ½μ μ²λ¦¬ν©λλ€.
- Saved Promptsλ μμ
μ μ λͺ©κ³Ό λͺ
λ Ήμ΄λ₯Ό μ§κ΄μ μΌλ‘ μ€μ ν μ μκ² λμμ€λλ€.
- μ΄λ κ² μ μ₯λ μμ μ Operatorμ μΈν°νμ΄μ€ μλ¨μμ μΈμ λ μ‘μΈμ€ κ°λ₯νλ©°, λ€μν μλ리μ€μμ μ μ©νκ² νμ©λ μ μμ΅λλ€.
- μλ₯Ό λ€μ΄:
- λ§€μ£Ό λ°λ³΅λλ μμ (μ: μ κΈ°μ μΈ μ₯보기 λλ μ 무 λꡬ μΈν )
- 볡μ‘ν μμ½ νλ‘μΈμ€ κ°μν
- κ°μΈνλ μΌν λͺ©λ‘ μμ±
-
μ΄μ κ°μ μ¬λ‘λ Operatorκ° λ¨μν μμ μλνλ₯Ό λμ΄ μ¬μ©μ κ²½νμ κ°μΈννκ³ , λ°λ³΅ μμ μ ν¨μ¨μ±μ κ·Ήλνν μ μμμ 보μ¬μ€λλ€. μμ μ§ν μν©μ μκ°μ μΌλ‘ νμλλ©°, μ¬μ©μλ μΈμ λ μμ μ κ°μ νκ±°λ μμ ν μ μμ΅λλ€.
Evaluations
CUAλ μ¬λ¬ λ²€μΉλ§ν¬μμ μ΄μ μ΅κ³ μ±λ₯(State-of-the-Art, SOTA)μ κ°±μ νλ©° λ°μ΄λ μ±λ₯μ μ μ¦νμ΅λλ€.
μ΄λ₯Ό ν΅ν΄ λ€μν λμ§νΈ νκ²½μμ μμ μ μνν μ μλ λ₯λ ₯μ κ²μ¦λ°μμ΅λλ€.
1. OSWorld (Computer Use)
- OSWorld λ²€μΉλ§ν¬λ CUAκ° Ubuntu, Windows, macOS λ± λ€μν μ΄μ체μ λ₯Ό μ‘°μν μ μλ λ₯λ ₯μ νκ°ν©λλ€.
μ΄ νκ°μμλ OS μμμ μν κ°λ₯ν λ€μν μμ μ΄ ν¬ν¨λ©λλ€. μλ₯Ό λ€μ΄, λ€μκ³Ό κ°μ μμ λ€μ΄ ν¬ν¨λ©λλ€:
- νμΌ κ΄λ¦¬: ν΄λ μμ±, νμΌ μ΄λ/볡μ¬, νμΌ μ΄λ¦ λ³κ²½
- μ€μ μ‘°μ: νλ©΄ λ°κΈ° μ‘°μ , λ€νΈμν¬ μ€μ λ³κ²½
- μ ν리μΌμ΄μ μ€ν: νΉμ μ± μ€ν ν κ°λ¨ν μ‘°μ μν
CUAλ κΈ°μ‘΄μ SOTA λλΉ λμ μ μλ₯Ό κΈ°λ‘νλ©°, μ΄μ 체μ μ λ°μ μμ μ μννλ λ° μμ΄ μ μ°μ±κ³Ό μ±λ₯μ μ μ¦νμ΅λλ€.
π Computer useμ λν CUAμ Inference κ²°κ³Όλ OpenAIλΈλ‘κ·Έμμ νμΈνμ€ μ μμ΅λλ€.
2. WebArena (Browser Use)
- WebArenaλ μ€μ μΉ μ¬μ© μ¬λ‘λ₯Ό κΈ°λ°μΌλ‘ νμ¬ CUAμ μΉ νμ λ° μμ λ₯λ ₯μ νκ°ν©λλ€.
μ΄ λ²€μΉλ§ν¬λ λ€μκ³Ό κ°μ μμ μλ리μ€λ₯Ό ν¬ν¨ν©λλ€:
- μ μμκ±°λ: νΉμ μνμ κ²μνκ³ μ₯λ°κ΅¬λμ μΆκ° ν κ²°μ νμ΄μ§κΉμ§ μ§ν
- μ½ν μΈ κ΄λ¦¬(CMS): ν μ€νΈ μ λ ₯, μ΄λ―Έμ§ μ λ‘λ, κ°λ¨ν μΉ νμ΄μ§ κ²μ
- ν¬λΌ νλ: κ²μκΈ μμ±, λκΈ μΆκ°, νΉμ μ£Όμ κ²μ
WebArenaλ λ€μν μΉμ¬μ΄νΈμμμ μνΈμμ©μ μꡬνλ©°, CUAκ° μΌλ§λ μ νλ©΄μ μ΄ν΄νκ³ λͺ νν μμ μ μνν μ μλμ§ νκ°ν©λλ€.
3. WebVoyager (Browser Use)
- WebVoyagerλ λΌμ΄λΈ μΉμ¬μ΄νΈμμμ μμ λ₯λ ₯μ νκ°νλ λ²€μΉλ§ν¬μ λλ€.
μ΄ νκ°μμλ Amazon, GitHub, Google Maps λ± λ리 μ¬μ©λλ μΉμ¬μ΄νΈμμ λ€μκ³Ό κ°μ μμ μ΄ μνλ©λλ€:
- Amazon: νΉμ 쑰건(μ: κ°κ²© λ²μ, νμ )μΌλ‘ μν κ²μ λ° νν°λ§
- GitHub: 리ν¬μ§ν 리 κ²μ, νΉμ νμΌ λ€μ΄λ‘λ
- Google Maps: νΉμ μμΉ κ²μ, κ²½λ‘ νμ
WebVoyagerλ μ€μ μ¬μ©μκ° μΉμμ μννλ κ³Όμ κ³Ό μ μ¬ν 볡μ‘ν μμ μ ν¬ν¨νλ©°, CUAμ μ€μ νμ© κ°λ₯μ±μ μ§μ μ μΌλ‘ 보μ¬μ€λλ€. νΉν, μ΄ λ²€μΉλ§ν¬μμ 87%λΌλ λμ μ±κ³΅λ₯ μ κΈ°λ‘ν κ²μ CUAμ μ λ°ν μμ μ²λ¦¬ λ₯λ ₯μ λνλ λλ€.
π Browser Useμ λν CUAμ Inference κ²°κ³Όλ OpenAIλΈλ‘κ·Έμμ νμΈνμ€ μ μμ΅λλ€.
μ΄λ¬ν κ²°κ³Όλ CUAκ° λ€μν νκ²½μμ μ λ’°ν μ μλ λκ΅¬λ‘ μ리μ‘μ κ°λ₯μ±μ 보μ¬μ€λλ€.
- λμ±μ΄, μμ μκ°μ΄ μ¦κ°ν μλ‘ μ±λ₯μ΄ ν₯μλλ βν μ€νΈ μκ° μ€μΌμΌλ§β ν¨κ³Όλ κ΄μ°°λμμ΅λλ€.
Operatorλ₯Ό ν΅ν΄ μ΄λ¬ν μ±λ₯μ μ¬μ©μ κ²½νκ³Ό κ²°ν©νμ¬ λμ± κ°λ ₯ν λκ΅¬λ‘ λ°μ νκ³ μμ΅λλ€.
Safety
CUAλ μ¬μ©μμ μμ μ μ΅μ°μ μΌλ‘ κ³ λ €νμ¬ μ€κ³λμμ΅λλ€.
Operatorμ ν¨κ» μ 곡λλ Operator System Cardλ CUAμ μμ κΈ°λ₯μ μμΈν μ€λͺ νλ©°, μ£Όμ μν μμλ₯Ό λ€μ μΈ κ°μ§λ‘ λΆλ₯νκ³ μμ΅λλ€:
-
Misuse (μ€μ©)
- CUAλ λΆλ²μ μ΄κ±°λ κ·μ λ μμ μ λν΄ κ±°λΆνλλ‘ νμ΅λμμ΅λλ€.
- λλ°, μ±μΈ μ½ν μΈ , 무기 κ±°λ μ¬μ΄νΈ λ±μ μ¬μ μ°¨λ¨λ λΈλ‘리μ€νΈμ ν¬ν¨λ©λλ€.
- μ€μκ° μλνλ μμ μ κ² λ° μ¬μ©μ νλ λͺ¨λν°λ§μ ν΅ν΄ μ μ± μλ°μ κ°μ§ν©λλ€.
-
Model Mistakes (λͺ¨λΈ μ€μ)
- μμ μ μννκΈ° μ μ μ¬μ©μ νμΈ(confirmation)μ μμ²ν©λλ€.
- νΉν λ―Όκ°ν μμ μλ μΆκ°μ μΈ νμΈ κ³Όμ μ κ±°μΉ©λλ€.
- μν κ±°λμ κ°μ κ³ μν μμ μ μμ μννμ§ μλλ‘ μ νλ©λλ€.
- μ΄λ©μΌκ³Ό κ°μ λ―Όκ°ν μΉμ¬μ΄νΈμμλ βWatch Modeβλ₯Ό ν΅ν΄ μ¬μ©μκ° μ§μ μμ μ κ°λ νλλ‘ ν©λλ€.
-
Adversarial Attacks (μ λμ 곡격)
- ν둬ννΈ μΈμ μ , νΌμ± μλ λ±μ νμ§νκ³ μ°¨λ¨ν©λλ€.
- νλ©΄μ μμν μ½ν μΈ λ₯Ό κ°μ§νκ³ μμ μ μΌμ μ€μ§ν©λλ€.
CUAλ μ΄μ€, μΌμ€ λ°©μ΄ κ΅¬μ‘°λ₯Ό ν΅ν΄ μμ μ±μ κ°ννλ©°, μ§μμ μΈ νΌλλ°±κ³Ό κ°μ μ ν΅ν΄ λμ± μμ ν νκ²½μ μ 곡νκ³ μ ν©λλ€.
- νΉν, Operator λ΄μμ λͺ¨λΈμ λͺ¨λ μμ μ κΈ°λ‘ λ° κ²ν λ μ μμΌλ©°, μ΄λ μ μ¬μ μΈ μ€λ₯λ μ μμ μΈ μ¬μ©μ λ°©μ§νλ λ° μ€μν μν μ ν©λλ€.
- Operatorλ μ¬μ©μμκ² μμ μ ν¬λͺ μ±μ μ 곡νλ©°, μμ μ€ λ°μν μ μλ μ€λ₯λ μν μμλ₯Ό μ΅μννκΈ° μν μμ μ₯μΉλ₯Ό λ€μ ν¬ν¨νκ³ μμ΅λλ€.
μ¬μ©μ νμΈ μμ€ν κ³Ό μ€μκ° λͺ¨λν°λ§, κ·Έλ¦¬κ³ νμμ μ¬μ©μκ° μ»¨νΈλ‘€μ λ겨λ°μ μ μλ κΈ°λ₯μ Operatorμ CUAκ° μμ νκ² μμ μ μνν μ μλλ‘ μ§μν©λλ€.
Operatorμ λ―Έλ μ λ§
Operatorμ CUAλ λμ§νΈ μμ μλνμ μλ‘μ΄ ν¨λ¬λ€μμ μ μνλ©°, μμΌλ‘λ μ§μμ μΌλ‘ κ°μ λκ³ νμ₯λ μμ μ λλ€.
-
κ°λ°μ μ§μ:
- CUAλ₯Ό API ννλ‘ μ 곡νμ¬, κ°λ°μλ€μ΄ μμ λ§μ μμ΄μ νΈλ₯Ό ꡬμΆνκ±°λ κΈ°μ‘΄ μν¬νλ‘μ°λ₯Ό μ΅μ νν μ μλλ‘ μ§μν κ³νμ λλ€.
-
νμ₯λ μ κ·Όμ±:
- νμ¬λ Pro μ¬μ©μμκ²λ§ μ 곡λμ§λ§, μμΌλ‘ Plus, Team, Enterprise μ¬μ©μλ₯Ό ν¬ν¨ν λ λμ μ¬μ©μμΈ΅μΌλ‘ νλλ μμ μ λλ€.
-
κ³ λνλ κΈ°λ₯:
- Operatorμ κΈ°λ₯μ κ³ λννμ¬ λ 볡μ‘νκ³ κΈ΄ μμ νλ¦μ μ²λ¦¬ν μ μλλ‘ κ°λ°ν κ²μ λλ€.
APIλ μ΄λ€μμΌλ‘ μ 곡ν΄μ€μ§ κΆκΈνκ΅°μ ( β’Ν β¦ β’Ν )
Conclusion
CUAλ λ©ν°λͺ¨λ¬ μ΄ν΄, μΆλ‘ , μμ μ± μΈ‘λ©΄μμ νκΈ°μ μΈ λ°μ μ μ΄λ£¬ μμ΄μ νΈμ λλ€. APIμ μμ‘΄νμ§ μκ³ λ μ¬λμ΄ μ¬μ©νλ κ²κ³Ό λμΌν μΈν°νμ΄μ€λ₯Ό ν΅ν΄ λ€μν λμ§νΈ νκ²½μ μ μν μ μλ μ μ°μ±μ μ 곡ν©λλ€. μ΄λ AIκ° μΈκ°κ³Ό ν¨κ» μμ νλ©° μμ°μ±κ³Ό μ°½μμ±μ κ·Ήλνν μ μλ μλ‘μ΄ κ°λ₯μ±μ μ΄μ΄μ€λλ€.
νμ¬ Operatorλ₯Ό ν΅ν΄ λ―Έκ΅μ Pro Tier μ¬μ©μλ€μκ² μ°κ΅¬ ν리뷰 ννλ‘ μ 곡λλ©°, μ¬μ©μμ νΌλλ°±μ ν΅ν΄ μ§μμ μΌλ‘ κ°μ λ μμ μ λλ€. OpenAIλ CUAκ° λ€μν λμ§νΈ μμ μ βλ‘±ν μΌβμ ν΄κ²°νλ λ° μ€μν λκ΅¬κ° λ κ²μ΄λΌ λ―Ώμ΅λλ€. ν₯ν CUAλ λμ± λ€μν μμ νκ²½κ³Ό 볡μ‘ν λ¬Έμ λ₯Ό ν΄κ²°νλ©°, AI κΈ°μ μ μλ‘μ΄ κΈ°μ€μ μ μν κ²μ λλ€.
Operatorλ λ¨μν μμ λκ΅¬κ° μλλΌ, μ¬μ©μμ λμ§νΈ νκ²½μ λμ± νΈλ¦¬νκ³ μμ νκ² λ§λλ βννΈλβλ‘ μ리 μ‘κ³ μμ΅λλ€. OpenAIλ Operatorμ CUAλ₯Ό ν΅ν΄ λμ§νΈ μμ μ λ―Έλλ₯Ό μ΄μ΄κ°λ©°, AIκ° μ¬μ©μμ ν¨κ» μ±μ₯νλ μλ‘μ΄ ν¨λ¬λ€μμ μ μνκ³ μ ν©λλ€.