[OpenAI] Introduction to Operator & Agents : Computer-Using Agent

Posted by Euisuk's Dev Log on January 24, 2025

[OpenAI] Introduction to Operator & Agents : Computer-Using Agent

원본 κ²Œμ‹œκΈ€: https://velog.io/@euisuk-chung/OpenAI-Introduction-to-Operator-Agents-Computer-Using-Agent

What is Computer-Using Agent (CUA)?

πŸ“š μ°Έκ³  자료 : OpenAI blog

Youtube μ†Œκ°œ μ˜μƒ: Introduction to Operator & Agents

Computer-Using Agent(CUA)λŠ” OpenAIμ—μ„œ μƒˆλ‘­κ²Œ μΆœμ‹œν•œ μ—μ΄μ „νŠΈλ‘œ, μ‚¬λžŒμ²˜λŸΌ 컴퓨터λ₯Ό μ‘°μž‘ν•  수 μžˆλŠ” κΈ°λŠ₯을 μ œκ³΅ν•©λ‹ˆλ‹€.

  • CUAλŠ” κ·Έλž˜ν”½ μ‚¬μš©μž μΈν„°νŽ˜μ΄μŠ€(GUI)λ₯Ό 직접 μ‘°μž‘ν•˜λ©°, λ²„νŠΌ 클릭, 슀크둀, ν…μŠ€νŠΈ μž…λ ₯ λ“±μ˜ μž‘μ—…μ„ μˆ˜ν–‰ν•  수 μžˆμŠ΅λ‹ˆλ‹€.
    • μ΄λŸ¬ν•œ μ ‘κ·Ό 방식은 기쑴의 OS- λ˜λŠ” μ›Ή-νŠΉν™” API 없이도 λ‹€μ–‘ν•œ λ””μ§€ν„Έ ν™˜κ²½μ—μ„œ μœ μ—°ν•˜κ²Œ μž‘μ—…μ„ μ²˜λ¦¬ν•  수 μžˆλ„λ‘ λ§Œλ“€μ–΄μ€λ‹ˆλ‹€.
    • 특히, 이 λͺ¨λΈμ€ GPT-4o의 λΉ„μ „(vision) κΈ°λŠ₯κ³Ό κ°•ν™”ν•™μŠ΅ 기반의 κ³ λ„ν™”λœ μΆ”λ‘  λŠ₯λ ₯을 κ²°ν•©ν•˜μ—¬ κ°•λ ₯ν•œ μ„±λŠ₯을 λ°œνœ˜ν•©λ‹ˆλ‹€.

CUAλŠ” λ‹¨μˆœν•œ μž‘μ—…μ—μ„œλΆ€ν„° λ³΅μž‘ν•œ 닀단계 μž‘μ—…κΉŒμ§€ μ²˜λ¦¬ν•  수 μžˆλŠ” λ²”μš©μ„±μ„ μžλž‘ν•©λ‹ˆλ‹€.

  • 기쑴의 AI μ‹œμŠ€ν…œμ΄ νŠΉμ •ν•œ API에 μ˜μ‘΄ν•΄ ν•œμ •μ μΈ μž‘μ—…λ§Œ μˆ˜ν–‰ν•  수 μžˆμ—ˆλ‹€λ©΄, CUAλŠ” 인간이 컴퓨터λ₯Ό λ‹€λ£¨λŠ” 방식 κ·ΈλŒ€λ‘œ μž‘μ—…μ„ μˆ˜ν–‰ν•˜λ©° λ””μ§€ν„Έ μ„Έκ³„μ—μ„œ μƒˆλ‘œμš΄ κ°€λŠ₯성을 μ—΄μ–΄μ€λ‹ˆλ‹€.
  • 이둜써 μ‚¬μš©μžλŠ” λ‹¨μˆœνžˆ λͺ…λ Ήλ§Œ μ „λ‹¬ν•˜κ³ , λ‚˜λ¨Έμ§€ μž‘μ—…μ€ CUAκ°€ 효율적으둜 μ²˜λ¦¬ν•  수 μžˆλ„λ‘ ν•©λ‹ˆλ‹€.

특히, Operator와 ν•¨κ»˜ 제곡됨으둜써, β€œCUAλŠ” λ‹¨μˆœν•œ μžλ™ν™” 도ꡬλ₯Ό λ„˜μ–΄μ„œλŠ” β€˜λ””μ§€ν„Έ 쑰수(digital agent)β€™λ‘œ 자리 μž‘μ„ κ²ƒβ€œμ΄λΌκ³  μ„€λͺ…ν•©λ‹ˆλ‹€.

  • OperatorλŠ” CUA의 κ°•λ ₯ν•œ κΈ°λŠ₯을 μ‚¬μš©μžκ°€ λ”μš± νŽΈλ¦¬ν•˜κ²Œ ν™œμš©ν•  수 μžˆλ„λ‘ λ•λŠ” μ‹œμŠ€ν…œμœΌλ‘œ, μ‚¬μš©μž μΉœν™”μ μΈ μΈν„°νŽ˜μ΄μŠ€μ™€ λ‹€μ–‘ν•œ μ•ˆμ „ μž₯치λ₯Ό 톡해 CUA의 잠재λ ₯을 κ·ΉλŒ€ν™”ν•©λ‹ˆλ‹€.
  • OperatorλŠ” μ‚¬μš©μžκ°€ μ£Όμ–΄μ§„ μž‘μ—…μ„ μ •ν™•ν•˜κ³  μ‹ μ†ν•˜κ²Œ μ²˜λ¦¬ν•  수 μžˆλ„λ‘ μ§€μ›ν•˜λ©°, μ‹€μ‹œκ°„μœΌλ‘œ μƒν˜Έμž‘μš©ν•˜λ©° μž‘μ—…μ˜ 투λͺ…μ„±κ³Ό 신뒰성을 보μž₯ν•©λ‹ˆλ‹€.

Operator ν™”λ©΄ (좜처: https://operator.chatgpt.com/)

개인적으둜 Computer-Using Agent (CUA)와 Operator의 μ •μ˜κ°€ λͺ¨ν˜Έν•œ 것 κ°™μ•„μ„œ ν•œλ²ˆ μ •λ¦¬ν•΄λ³΄μ•˜μŠ΅λ‹ˆλ‹€:

  • CUAλŠ” Operator의 핡심 기술적 기반이며, GUI μ‘°μž‘μ„ μ€‘μ‹¬μœΌλ‘œ ν•˜λŠ” λ²”μš© μ—μ΄μ „νŠΈμž…λ‹ˆλ‹€.
  • 반면, OperatorλŠ” 이λ₯Ό μ‹€μš©μ μ΄κ³  μ‚¬μš©μžκ°€ μ‰½κ²Œ μ ‘κ·Όν•  수 μžˆλ„λ‘ λ§Œλ“  μƒμœ„ 레벨 μ—μ΄μ „νŠΈλ‘œ, μ‚¬μš©μž κ²½ν—˜μ— 쀑점을 λ‘” μ„œλΉ„μŠ€μž…λ‹ˆλ‹€.
    • OperatorλŠ” CUA의 λŠ₯λ ₯을 톡해 λ””μ§€ν„Έ μž‘μ—…μ„ 효율적으둜 μˆ˜ν–‰ν•˜λ©°, 특히 일상적인 μž‘μ—…μ„ μžλ™ν™”ν•˜κ³  λ‹¨μˆœν™”ν•˜λŠ” 데 μ΄ˆμ μ„ 맞μΆ₯λ‹ˆλ‹€.

각각 Computer-Using Agent (CUA)와 Operator의 κ°œλ…μ„ μ’€ 더 λ©΄λ°€ν•˜κ²Œ νŒŒμ•…ν•΄λ³΄κ² μŠ΅λ‹ˆλ‹€.

πŸ’» Computer-Using Agent (CUA)

  • μ •μ˜:
    • Computer-Using Agent(CUA)λŠ” β€œκ·Έλž˜ν”½ μ‚¬μš©μž μΈν„°νŽ˜μ΄μŠ€(GUI)λ₯Ό 직접 μ‘°μž‘ν•  수 μžˆλ„λ‘ μ„€κ³„λœ AI μ—μ΄μ „νŠΈβ€μž…λ‹ˆλ‹€.
    • ν™”λ©΄μ˜ ν”½μ…€ 데이터λ₯Ό μ΄ν•΄ν•˜κ³ , 마우슀 클릭, ν‚€λ³΄λ“œ μž…λ ₯, 슀크둀 λ“± μ‚¬μš©μžκ°€ ν™”λ©΄κ³Ό μƒν˜Έμž‘μš©ν•˜λŠ” 방식 κ·ΈλŒ€λ‘œ μž‘μ—…μ„ μˆ˜ν–‰ν•©λ‹ˆλ‹€.
  • μ£Όμš” νŠΉμ§•:
    • μ‹œκ° 및 μƒν˜Έμž‘μš© λŠ₯λ ₯: CUAλŠ” 화면을 β€œλ³΄κ³ β€ μ΄ν•΄ν•˜λ©°, 이λ₯Ό λ°”νƒ•μœΌλ‘œ μž‘μ—…μ„ μˆ˜ν–‰ν•©λ‹ˆλ‹€.
    • κ°•ν™”ν•™μŠ΅ 기반: κ³ κΈ‰ μΆ”λ‘  λŠ₯λ ₯κ³Ό Chain-of-Thought 방식을 ν™œμš©ν•˜μ—¬ λ³΅μž‘ν•œ μž‘μ—… 흐름도 μ²˜λ¦¬ν•  수 μžˆμŠ΅λ‹ˆλ‹€.
    • 독립적 μž‘μ—… μˆ˜ν–‰: API에 μ˜μ‘΄ν•˜μ§€ μ•Šκ³ , μΈκ°„μ²˜λŸΌ λ””μ§€ν„Έ μΈν„°νŽ˜μ΄μŠ€λ₯Ό λ‹€λ£° 수 μžˆμŠ΅λ‹ˆλ‹€.
  • μ‚¬μš© λ²”μœ„:
    • CUAλŠ” νŠΉμ • ν”Œλž«νΌμ— μ œν•œλ˜μ§€ μ•Šκ³ , 일반적인 λ””μ§€ν„Έ ν™˜κ²½μ—μ„œ λ‹€μ–‘ν•˜κ²Œ ν™œμš©λ©λ‹ˆλ‹€.
    • 예λ₯Ό λ“€μ–΄, μ›Ή 검색, 데이터 μž…λ ₯, ν™”λ©΄ μƒν˜Έμž‘μš© 등을 톡해 μΈκ°„μ˜ μž‘μ—…μ„ λŒ€μ²΄ν•˜κ±°λ‚˜ λ³΄μ™„ν•©λ‹ˆλ‹€.

βš™οΈ Operator

  • μ •μ˜:
    • OperatorλŠ” CUA의 κΈ°λŠ₯을 μ‚¬μš©μž μΉœν™”μ μœΌλ‘œ κ΅¬ν˜„ν•œ OpenAI의 μƒμœ„ 레벨 μ—μ΄μ „νŠΈμž…λ‹ˆλ‹€.
    • OperatorλŠ” μ‚¬μš©μžμ™€ 직접 μƒν˜Έμž‘μš©ν•˜λ©°, μžμ—°μ–΄ λͺ…령을 톡해 CUA의 μž‘μ—…μ„ μ‘°μœ¨ν•˜κ³  κ²°κ³Όλ₯Ό μ œκ³΅ν•©λ‹ˆλ‹€.
  • μ£Όμš” νŠΉμ§•:
    • 직관적인 μΈν„°νŽ˜μ΄μŠ€: μ‚¬μš©μžλŠ” μžμ—°μ–΄λ‘œ μž‘μ—…μ„ μš”μ²­ν•˜λ©°, OperatorλŠ” 이λ₯Ό 해석해 CUAκ°€ μ‹€ν–‰ν•  수 μžˆλ„λ‘ μ²˜λ¦¬ν•©λ‹ˆλ‹€.
    • μ•ˆμ „ 및 μ œμ–΄: λ―Όκ°ν•œ μž‘μ—…(예: 둜그인, 결제)μ—μ„œλŠ” μ‚¬μš©μž κ°œμž…μ„ μš”μ²­ν•΄ μž‘μ—…μ˜ 신뒰성을 보μž₯ν•©λ‹ˆλ‹€.
    • κ°œμΈν™” κ°€λŠ₯: νŠΉμ • μ›Ήμ‚¬μ΄νŠΈλ‚˜ μž‘μ—…μ— λ§žλŠ” λ§žμΆ€ν˜• μ§€μ‹œλ₯Ό μ €μž₯ν•΄ 반볡 μž‘μ—… μ‹œ νš¨μœ¨μ„±μ„ λ†’μž…λ‹ˆλ‹€.
    • 데λͺ¨ 및 ν™•μž₯μ„±: μ‚¬μš©μž μ›Œν¬ν”Œλ‘œμš°λ₯Ό μ΅œμ ν™”ν•  수 μžˆλ„λ‘ μ„€κ³„λ˜μ—ˆμœΌλ©°, APIλ₯Ό 톡해 타 μ‹œμŠ€ν…œκ³Ό 톡합 κ°€λŠ₯ν•©λ‹ˆλ‹€.
  • μ‚¬μš© 사둀:
    • OperatorλŠ” CUAλ₯Ό 기반으둜, μ‚¬μš©μžκ°€ ν•„μš”λ‘œ ν•˜λŠ” μž‘μ—…μ„ μ§κ΄€μ μœΌλ‘œ μ²˜λ¦¬ν•˜λ©°, λ³΅μž‘ν•œ ν”„λ‘œμ„ΈμŠ€λ„ κ°„λ‹¨ν•œ λͺ…λ ΉμœΌλ‘œ ν•΄κ²°ν•©λ‹ˆλ‹€.
    • 예: ν˜Έν…” μ˜ˆμ•½, μ‡Όν•‘, 데이터 μž…λ ₯, μž‘μ—… μžλ™ν™” λ“±.

차이점

ꡬ뢄 Computer-Using Agent (CUA) Operator
μ£Όμš” μ—­ν•  GUIλ₯Ό μ‘°μž‘ν•˜λ©° μž‘μ—…μ„ μˆ˜ν–‰ν•˜λŠ” AI μ‹œμŠ€ν…œ μ‚¬μš©μžμ™€ μƒν˜Έμž‘μš©ν•˜λ©°, CUA의 κΈ°λŠ₯을 ν™œμš©ν•΄ μž‘μ—…μ„ κ΄€λ¦¬ν•˜κ³  처리
μ ‘κ·Ό 방식 κ°•ν™”ν•™μŠ΅ 기반의 μΆ”λ‘  λŠ₯λ ₯을 톡해 λ…λ¦½μ μœΌλ‘œ μž‘μ—… μˆ˜ν–‰ μ‚¬μš©μž μΉœν™”μ  μΈν„°νŽ˜μ΄μŠ€λ‘œ μž‘μ—… μš”μ²­μ„ μ²˜λ¦¬ν•˜κ³  κ²°κ³Όλ₯Ό 제곡
μ‚¬μš© λ²”μœ„ νŠΉμ • μž‘μ—… μˆ˜ν–‰λ³΄λ‹€λŠ” λ²”μš©μ μΈ μ—μ΄μ „νŠΈ ν”„λ ˆμž„μ›Œν¬ 제곡 μ›Ή λΈŒλΌμš°μ € 및 GUI μƒμ˜ ꡬ체적 μž‘μ—…μ„ μ‹€μ‹œκ°„μœΌλ‘œ 처리
μ•ˆμ „ μž₯치 내뢀적인 μΆ”λ‘  과정을 톡해 μž‘μ—…μ˜ 적합성을 νŒλ‹¨ μ‚¬μš©μž κ°œμž…μ„ μš”μ²­ν•˜κ±°λ‚˜, μž‘μ—… 승인 μš”μ²­μ„ 톡해 λ―Όκ°ν•œ 정보 보호
적용 사둀 연ꡬ 개발 및 API 톡합을 ν†΅ν•œ κ³ κΈ‰ μ—μ΄μ „νŠΈ κ΅¬ν˜„ μ›Ή 기반 μžλ™ν™” μž‘μ—…(ν˜Έν…” μ˜ˆμ•½, μ‡Όν•‘ 리슀트 관리, 곡곡 μ„œλΉ„μŠ€ 이용 λ“±)
ν™•μž₯μ„± APIλ₯Ό 톡해 λ‹€μ–‘ν•œ 개발자 및 μ‹œμŠ€ν…œμ— 톡합 κ°€λŠ₯ μ‚¬μš©μž λ§žμΆ€ν˜• μ„€μ • 및 닀쀑 μž‘μ—… 관리 κΈ°λŠ₯ 제곡

How it works

CUAλŠ” ν™”λ©΄μ˜ ν”½μ…€ 데이터λ₯Ό μ΄ν•΄ν•˜κ³  가상 λ§ˆμš°μŠ€μ™€ ν‚€λ³΄λ“œλ₯Ό μ‚¬μš©ν•΄ μž‘μ—…μ„ μˆ˜ν–‰ν•©λ‹ˆλ‹€.

CUA Diagram (좜처: https://openai.com/index/computer-using-agent/)

  • μ‚¬μš©μžκ°€ μž‘μ—…μ„ μš”μ²­ν•˜λ©΄ CUAλŠ” λ‹€μŒκ³Ό 같은 반볡적인 루프λ₯Ό 톡해 이λ₯Ό μˆ˜ν–‰ν•©λ‹ˆλ‹€:

    1. Perception (지각):

      • ν˜„μž¬ ν™”λ©΄μ˜ μŠ€ν¬λ¦°μƒ·μ„ λΆ„μ„ν•˜μ—¬ 컴퓨터 μƒνƒœλ₯Ό μ΄ν•΄ν•©λ‹ˆλ‹€.
      • 이 κ³Όμ •μ—μ„œ 화면에 λ‚˜νƒ€λ‚œ ν…μŠ€νŠΈμ™€ 이미지λ₯Ό 뢄석해 ν˜„μž¬ μƒνƒœλ₯Ό μ •ν™•νžˆ νŒŒμ•…ν•©λ‹ˆλ‹€.

    2. Reasoning (μΆ”λ‘ ):

      • Chain-of-Thought 방식을 μ‚¬μš©ν•˜μ—¬ ν˜„μž¬μ™€ 이전 μž‘μ—… μƒνƒœλ₯Ό κ³ λ €ν•˜λ©° λ‹€μŒμ— μˆ˜ν–‰ν•  단계λ₯Ό κ³„νšν•©λ‹ˆλ‹€.
      • μ΄λ•Œ, λ‚΄λΆ€μ μœΌλ‘œ μˆ˜ν–‰ 단계λ₯Ό μ„ΈλΆ„ν™”ν•˜μ—¬ 졜적의 ν•΄κ²° 방식을 μ°Ύμ•„λƒ…λ‹ˆλ‹€.

    3. Action (행동):

      • 마우슀 클릭, 슀크둀, ν…μŠ€νŠΈ μž…λ ₯ λ“±μ˜ μž‘μ—…μ„ μ‹€ν–‰ν•˜λ©°, ν•„μš”μ‹œ μ‚¬μš©μž 확인을 μš”μ²­ν•©λ‹ˆλ‹€.

      • μΆ”κ°€μ μœΌλ‘œ 둜그인 정보 μž…λ ₯μ΄λ‚˜ CAPTCHA 확인 같은 λ―Όκ°ν•œ μž‘μ—…μ—λŠ” μ‚¬μš©μžμ˜ 확인을 λ°›μŠ΅λ‹ˆλ‹€.

CUAλŠ” μ΄λŸ¬ν•œ 과정을 톡해 λ³΅μž‘ν•œ 문제λ₯Ό μ²΄κ³„μ μœΌλ‘œ ν•΄κ²°ν•˜λ©°, OperatorλŠ” μ΄λŸ¬ν•œ CUA의 μž‘λ™ 방식을 μ§κ΄€μ μœΌλ‘œ ν™œμš©ν•  수 μžˆλ„λ‘ μ§€μ›ν•©λ‹ˆλ‹€:

  • 예λ₯Ό λ“€μ–΄, λΈŒλΌμš°μ € λ‚΄μ—μ„œ 데이터λ₯Ό κ²€μƒ‰ν•˜κ³  μž…λ ₯ν•˜κ±°λ‚˜, μ—¬λŸ¬ 단계λ₯Ό 거쳐 λͺ©ν‘œλ₯Ό λ‹¬μ„±ν•˜λŠ” λ“± λ‹€μ–‘ν•œ μž‘μ—… μ‹œλ‚˜λ¦¬μ˜€μ—μ„œ νƒμ›”ν•œ μ„±λŠ₯을 λ°œνœ˜ν•©λ‹ˆλ‹€.
    • λ˜ν•œ, μž‘μ—… 쀑 λ°œμƒν•˜λŠ” 였λ₯˜λ₯Ό 슀슀둜 μˆ˜μ •ν•˜λ©° μ μ‘μ μœΌλ‘œ ν–‰λ™ν•©λ‹ˆλ‹€.

μ•„λž˜λŠ” Operatorμ—μ„œ λͺ‡κ°€μ§€ usage scenario듀을 μ •μ˜ν•΄μ„œ sample둜 보여주고 μžˆλŠ” 것을 확인할 수 μžˆλŠ” κ·Έλ¦Όμž…λ‹ˆλ‹€.

μ›Ήμ—μ„œ μˆ˜ν–‰ν•  수 μžˆλŠ” μ›¬λ§Œν•œ κΈ°λŠ₯듀은 Operatorλ₯Ό 톡해 μž‘μ—…μ„ μˆ˜ν–‰ν•΄λ³Ό 수 μžˆλŠ” 것을 확인할 수 μžˆμŠ΅λ‹ˆλ‹€. (ex. μ£Όλ¬Έ, μ˜ˆμ•½, μ‡Όν•‘ λ“±)

  • μ‚¬μš©μžλŠ” Operatorλ₯Ό 톡해 λ‹¨μˆœνžˆ μžμ—°μ–΄λ‘œ μž‘μ—…μ„ μ§€μ‹œν•  수 있으며, CUAλŠ” ν•΄λ‹Ή μ§€μ‹œμ— 따라 ν•„μš”ν•œ μž‘μ—…μ„ μˆ˜ν–‰ν•©λ‹ˆλ‹€.
  • OperatorλŠ” μž‘μ—… μ§„ν–‰ 상황을 μ‹œκ°μ μœΌλ‘œ ν‘œμ‹œν•˜λ©°, μ‚¬μš©μžκ°€ ν•„μš”μ‹œ κ°œμž…ν•˜μ—¬ μž‘μ—…μ„ μ‘°μ •ν•  수 μžˆλ„λ‘ λ•μŠ΅λ‹ˆλ‹€.

    • 예λ₯Ό λ“€μ–΄, μ‚¬μš©μžλŠ” νŠΉμ • μž‘μ—… λ‹¨κ³„μ—μ„œ 직접 μ»¨νŠΈλ‘€μ„ λ„˜κ²¨λ°›μ•„ μž‘μ—…μ„ μˆ˜μ •ν•˜κ±°λ‚˜, CUAκ°€ μ œμ•ˆν•œ κ²°κ³Όλ₯Ό ν™•μΈν•˜κ³  μŠΉμΈμ„ 내릴 수 μžˆμŠ΅λ‹ˆλ‹€.

Agent와 Operator의 κ°œλ… ν™•μž₯

AgentλŠ” λ‹¨μˆœνžˆ μ£Όμ–΄μ§„ λͺ…령을 μ‹€ν–‰ν•˜λŠ” 도ꡬλ₯Ό λ„˜μ–΄, μ‚¬μš©μžκ°€ λͺ©ν‘œλ₯Ό μ„€μ •ν•˜λ©΄ ν•΄λ‹Ή λͺ©ν‘œλ₯Ό λ‹¬μ„±ν•˜κΈ° μœ„ν•œ λͺ¨λ“  μ„ΈλΆ€ 단계λ₯Ό 슀슀둜 κ³„νšν•˜κ³  μ‹€ν–‰ν•˜λŠ” AI μ‹œμŠ€ν…œμ„ μ˜λ―Έν•©λ‹ˆλ‹€. μ΄λŠ” μΈκ°„μ˜ μ‘°λ ₯을 μ΅œμ†Œν™”ν•˜λ©΄μ„œλ„ μ •ν™•μ„±κ³Ό νš¨μœ¨μ„±μ„ κ·ΉλŒ€ν™”ν•©λ‹ˆλ‹€.

OperatorλŠ” μ΄λŸ¬ν•œ Agent μ€‘μ—μ„œλ„ 특히 μ›Ή λΈŒλΌμš°μ €λ₯Ό ν™œμš©ν•œ μž‘μ—…μ„ μ „λ¬ΈμœΌλ‘œ ν•˜λ©°, μ‚¬μš©μžκ°€ μƒν˜Έμž‘μš©ν•˜λŠ” κ·Έλž˜ν”½ μΈν„°νŽ˜μ΄μŠ€λ₯Ό 직접 λ‹€λ£¨λŠ” μ μ—μ„œ 기쑴의 AI와 μ°¨λ³„ν™”λ©λ‹ˆλ‹€. 이둜 인해 APIλ‚˜ μ •ν•΄μ§„ ν”„λ‘œν† μ½œ 없이도 λŒ€λΆ€λΆ„μ˜ λ””μ§€ν„Έ ν™˜κ²½μ—μ„œ μž‘μ—…μ΄ κ°€λŠ₯ν•©λ‹ˆλ‹€.

Operator의 μ£Όμš” νŠΉμ§•μ€ λ‹€μŒκ³Ό κ°™μŠ΅λ‹ˆλ‹€:

  • μžμœ¨μ„±:

    • OperatorλŠ” λ‹¨μˆœνžˆ μ‚¬μš©μžμ˜ λͺ…령을 λ°›μ•„ μˆ˜ν–‰ν•˜λŠ” 것을 λ„˜μ–΄, μž‘μ—… 쀑 λ°œμƒν•˜λŠ” 문제λ₯Ό 슀슀둜 ν•΄κ²°ν•˜κ±°λ‚˜ λŒ€μ²΄ λ°©μ•ˆμ„ μ œμ•ˆν•©λ‹ˆλ‹€.
    • 예λ₯Ό λ“€μ–΄, μ‚¬μš©μžκ°€ μ˜ˆμ•½μ„ μš”μ²­ν–ˆμœΌλ‚˜ μ›ν•˜λŠ” μ‹œκ°„μ΄ λΆˆκ°€λŠ₯ν•œ 경우, μžλ™μœΌλ‘œ λŒ€μ²΄ μ‹œκ°„μ„ μ°Ύμ•„ μ œμ•ˆν•©λ‹ˆλ‹€.
  • μœ μ—°μ„±:

    • OperatorλŠ” νŠΉμ • μ›Ήμ‚¬μ΄νŠΈλ‚˜ μ†Œν”„νŠΈμ›¨μ–΄μ— ν•œμ •λ˜μ§€ μ•Šκ³ , λͺ¨λ“  λΈŒλΌμš°μ € 기반 μž‘μ—…μ—μ„œ ν™œμš© κ°€λŠ₯ν•˜λ‹€λŠ” μ μ—μ„œ 높은 μœ μ—°μ„±μ„ μ œκ³΅ν•©λ‹ˆλ‹€.
  • ν™•μž₯ κ°€λŠ₯μ„±:

    • OperatorλŠ” ν–₯ν›„ APIλ₯Ό 톡해 λ‹€μ–‘ν•œ μ™ΈλΆ€ μ• ν”Œλ¦¬μΌ€μ΄μ…˜κ³Ό 톡합될 수 있으며, κ°œλ°œμžκ°€ μžμ‹ μ˜ μ›Œν¬ν”Œλ‘œμš°μ— 맞게 μ»€μŠ€ν„°λ§ˆμ΄μ§•ν•  수 μžˆλŠ” ν™˜κ²½μ„ μ œκ³΅ν•©λ‹ˆλ‹€.

Agent와 OperatorλŠ” μ‚¬μš©μžμ˜ λ””μ§€ν„Έ κ²½ν—˜μ„ ν•œμΈ΅ 더 ν–₯μƒμ‹œν‚€κΈ° μœ„ν•œ λ„κ΅¬λ‘œ μ„€κ³„λ˜μ—ˆμŠ΅λ‹ˆλ‹€.

  • OperatorλŠ” λ‹¨μˆœν•œ μžλ™ν™”λ₯Ό λ„˜μ–΄ λ””μ§€ν„Έ μƒνƒœκ³„μ— μƒˆλ‘œμš΄ ν˜•νƒœμ˜ μƒν˜Έμž‘μš© 방식을 λ„μž…ν•©λ‹ˆλ‹€.
  • 고객 지원, μ „μžμƒκ±°λž˜, 곡곡 μ„œλΉ„μŠ€ λ“± λ‹€μ–‘ν•œ λΆ„μ•Όμ—μ„œ OperatorλŠ” μΈκ°„μ˜ μ‘°λ ₯μžλ‘œμ„œ μ‹œκ°„κ³Ό μžμ›μ„ μ ˆμ•½ν•©λ‹ˆλ‹€.
  • λ˜ν•œ, 곡곡기관과 기업이 μ‹œλ―Ό 참여와 고객 κ²½ν—˜μ„ κ°œμ„ ν•˜λŠ” 데 κΈ°μ—¬ν•  수 μžˆμŠ΅λ‹ˆλ‹€.

Operator의 ν™œμš© 사둀 (Demo)

OperatorλŠ” μ‹€μ œ ν™œμš© 사둀λ₯Ό 톡해 λ‹€μ–‘ν•œ μž‘μ—…μ—μ„œ AI의 νš¨μœ¨μ„±κ³Ό 정확성을 μž…μ¦ν–ˆμŠ΅λ‹ˆλ‹€.

μ°Έκ³  μ˜μƒ 링크:

μ•„λž˜λŠ” 데λͺ¨ μ˜μƒμ—μ„œ μ†Œκ°œλœ μ£Όμš” μ‚¬λ‘€λ“€μž…λ‹ˆλ‹€:

  1. Custom Instructions ν™œμš©

    • μ‚¬μš©μžλŠ” νŠΉμ • μ›Ήμ‚¬μ΄νŠΈμ— λŒ€ν•œ λ§žμΆ€ν˜• 섀정을 μΆ”κ°€ν•  수 μžˆμŠ΅λ‹ˆλ‹€.
      • 예λ₯Ό λ“€μ–΄, Pricelineμ—μ„œ μ—¬ν–‰ μ˜ˆμ•½ μ‹œ β€œν™˜λΆˆ κ°€λŠ₯ν•œ μš”κΈˆβ€κ³Ό β€œμ‘°μ‹ 포함” μ˜΅μ…˜μ„ μ„ ν˜Έν•˜λ„λ‘ μ„€μ •ν•  수 μžˆμŠ΅λ‹ˆλ‹€.
    • 이후 λ™μΌν•œ μž‘μ—… μš”μ²­ μ‹œ OperatorλŠ” μ΄λŸ¬ν•œ μ‚¬μš©μž 섀정을 μžλ™μœΌλ‘œ λ°˜μ˜ν•©λ‹ˆλ‹€.
  2. Instacartλ₯Ό μ΄μš©ν•œ μž₯보기

    • μ‚¬μš©μžκ°€ νŠΉμ • λ ˆμ‹œν”Όλ₯Ό μš”μ²­ν•˜λ©΄, OperatorλŠ” ν•΄λ‹Ή λ ˆμ‹œν”Όλ₯Ό κ²€μƒ‰ν•œ ν›„ ν•„μš”ν•œ 재료λ₯Ό Instacart μž₯λ°”κ΅¬λ‹ˆμ— μΆ”κ°€ν•©λ‹ˆλ‹€.

    • μ‚¬μš©μžλŠ” μ œμ™Έν•  ν•­λͺ©μ„ 미리 λͺ…μ‹œν•  μˆ˜λ„ 있으며, μž‘μ—… 쀑간에 Operatorκ°€ 확인을 μš”μ²­ν•©λ‹ˆλ‹€.
    • λ˜ν•œ Take Controlμ΄λΌλŠ” κΈ°λŠ₯을 톡해, μ‚¬μš©μžλŠ” μž‘μ—…μ˜ μ€‘μš”ν•œ μˆœκ°„μ— 직접 κ°œμž…ν•˜μ—¬ λ―Όκ°ν•œ 정보λ₯Ό μž…λ ₯ν•˜κ±°λ‚˜ 세뢀사항을 μˆ˜μ •ν•  수 μžˆμŠ΅λ‹ˆλ‹€. ν•΄λ‹Ή 데λͺ¨μ—μ„œλŠ” μ œν’ˆ μˆ˜λŸ‰ μΆ”κ°€ν•˜λŠ” 것을 μ‹œμ—°μœΌλ‘œ λ³΄μ—¬μ€λ‹ˆλ‹€. (+adding eggs)

    • μΆ”κ°€μ μœΌλ‘œ Take Control μ‹œμ—λŠ” μ‹€μ œ λΈŒλΌμš°μ €μ—μ„œ μ‚¬λžŒμ΄ 검색/μž…λ ₯ν•˜λŠ” λ°©μ‹μ²˜λŸΌ μ‚¬μš©λ©λ‹ˆλ‹€.

      • 예λ₯Ό λ“€μ–΄, μ‚¬μš©μžκ°€ Instacart에 λ‘œκ·ΈμΈν•˜κ±°λ‚˜ 결제 정보λ₯Ό μž…λ ₯ν•΄μ•Ό ν•˜λŠ” 경우, μš°λ¦¬κ°€ 직접 μž…λ ₯ ν›„ μ™„λ£Œν–ˆλ‹€κ³  μ „λ‹¬ν•΄μ£ΌλŠ” λ°©μ‹μœΌλ‘œλ„ 이용이 κ°€λŠ₯ν•©λ‹ˆλ‹€.
      • 이λ₯Ό 톡해 μ‚¬μš©μžλŠ” μž‘μ—…μ˜ λ³΄μ•ˆμ„±κ³Ό 신뒰성을 μœ μ§€ν•˜λ©΄μ„œλ„, Operator의 μžλ™ν™” κΈ°λŠ₯을 μ΅œλŒ€ν•œ ν™œμš©ν•  수 μžˆμŠ΅λ‹ˆλ‹€.
  3. OpenTable둜 μ˜ˆμ•½ν•˜κΈ°

    • OperatorλŠ” μ‚¬μš©μžκ°€ μ„ ν˜Έν•˜λŠ” μŒμ‹ μœ ν˜•κ³Ό λ ˆμŠ€ν† λž‘μ„ 기반으둜 μ˜ˆμ•½μ„ μ§„ν–‰ν•©λ‹ˆλ‹€. μ˜ˆμ•½ κ°€λŠ₯ν•œ μ‹œκ°„λŒ€λ₯Ό μ‚¬μš©μžμ™€ μƒν˜Έμž‘μš©ν•˜λ©° μ œμ•ˆν•˜κ³ , μ΅œμ’… 확인 ν›„ μ˜ˆμ•½μ„ μ™„λ£Œν•©λ‹ˆλ‹€.
    • Demo 상세 뢄석:
      • Prompt : Book me a table for 2 person at Beretta tonight at 7PM.

      • ν΄λΌμš°λ“œ 버츄얼 ν™˜κ²½μ—μ„œ AIκ°€ 직접 μ‘°μž‘ 쀑, μ›Ή 검색 및 μ˜ˆμ•½μ„ μˆ˜ν–‰ν•˜λŠ” 것을 λ³Ό 수 μžˆμŠ΅λ‹ˆλ‹€.

      • μ£Όμ†Œμ˜ 경우 Custom Instructions에 미리 μ§€μ •ν•΄λ‘ μœΌλ‘œμ¨ AIκ°€ 어디에 μ‚¬λŠ”μ§€κΉŒμ§€ νŒŒμ•… ν›„, μœ„μΉ˜μ— λ§žλŠ” 근처 μŒμ‹μ μœΌλ‘œ 검색/μ˜ˆμ•½μ„ μˆ˜ν–‰ν•  수 μžˆλ„λ‘ ν•©λ‹ˆλ‹€.

      • Human Interaction이 ν•„μš”ν•œ 경우, μ•„λž˜ κ·Έλ¦Όκ³Ό 같이 μ˜μ‚¬κ²°μ •μ„ μš”μ²­ν•˜λŠ” 것을 λ³Ό 수 μžˆμŠ΅λ‹ˆλ‹€.

      • Confirmation μž‘μ—… 전에 확인을 μš”μ²­ν•˜κ³ , 이λ₯Ό 수락 ν˜Ήμ€ κ±°μ ˆν•  수 μžˆμŠ΅λ‹ˆλ‹€.

  4. λ©€ν‹°ν…ŒμŠ€ν‚Ή κ°€λŠ₯
    • OperatorλŠ” λ™μ‹œμ— μ—¬λŸ¬ μž‘μ—…μ„ μˆ˜ν–‰ν•  수 μžˆλŠ” κΈ°λŠ₯을 μ§€μ›ν•©λ‹ˆλ‹€.
      • 예λ₯Ό λ“€μ–΄, ν•œμͺ½ νƒ­μ—μ„œλŠ” 농ꡬ κ²½κΈ° μ˜ˆμ•½ μž‘μ—…μ„ μ§„ν–‰ν•˜λ©΄μ„œ λ‹€λ₯Έ νƒ­μ—μ„œλŠ” ν”Όμž 주문을 μ§„ν–‰ν•  수 μžˆμŠ΅λ‹ˆλ‹€.
    • μ΄λŠ” Operator의 κ°•λ ₯ν•œ μž‘μ—… λΆ„ν•  및 λ™μ‹œ 처리 λŠ₯λ ₯을 λ³΄μ—¬μ£ΌλŠ” μ‚¬λ‘€μž…λ‹ˆλ‹€.
      • 데λͺ¨μ—μ„œ ν™•μΈλœ 이 κΈ°λŠ₯은 Operatorκ°€ λ‹¨μˆœνžˆ 반볡적인 μž‘μ—…μ„ μ²˜λ¦¬ν•˜λŠ” 것을 λ„˜μ–΄ λ³΅μž‘ν•œ λ©€ν‹°νƒœμŠ€ν‚Ή μ‹œλ‚˜λ¦¬μ˜€λ₯Ό 지원할 수 μžˆμŒμ„ λ³΄μ—¬μ€λ‹ˆλ‹€.
  5. Save Prompts κΈ°λŠ₯
    • β€œSaved Promptsβ€λŠ” μ‚¬μš©μžκ°€ 반볡적으둜 μˆ˜ν–‰ν•˜λŠ” μž‘μ—…μ„ 미리 μ •μ˜ν•˜κ³  μ €μž₯ν•˜μ—¬ 이후 μ†μ‰½κ²Œ μž¬μ‚¬μš©ν•  수 μžˆλ„λ‘ λ•λŠ” κΈ°λŠ₯μž…λ‹ˆλ‹€.

    • 예λ₯Ό λ“€μ–΄ μ‚¬μš©μžκ°€ κΈˆμš”μΌ 저녁에 자주 νŠΉμ • λ ˆμŠ€ν† λž‘μ—μ„œ 저녁 식사λ₯Ό μ˜ˆμ•½ν•œλ‹€κ³  κ°€μ •ν•΄ λ³΄κ² μŠ΅λ‹ˆλ‹€. 이 μž‘μ—…μ„ Saved Prompts에 μ €μž₯ν•˜λ©΄, μ‚¬μš©μžλŠ” 맀번 λ™μΌν•œ 과정을 λ°˜λ³΅ν•˜μ§€ μ•Šκ³ , μ €μž₯된 μž‘μ—…μ„ ν΄λ¦­ν•˜μ—¬ λ°”λ‘œ μ‹€ν–‰ν•  수 μžˆμŠ΅λ‹ˆλ‹€.
      • (1) OpenTable을 ν™œμš©ν•΄ μ˜ˆμ•½μ„ μ €μž₯ν•΄ 두면, OperatorλŠ” λ‹€μŒ λ²ˆμ— μ˜ˆμ•½ν•  λ•Œ μ €μž₯된 정보λ₯Ό μžλ™μœΌλ‘œ λΆˆλŸ¬μ™€ μ‹€ν–‰ν•©λ‹ˆλ‹€.
      • (2) β€œμ€‘μ‹ λ ˆμŠ€ν† λž‘ μ˜ˆμ•½β€κ³Ό 같은 κ°„λ‹¨ν•œ λͺ…λ Ήμ–΄λ₯Ό μž…λ ₯ν•˜κΈ°λ§Œ ν•˜λ©΄, Operatorκ°€ μžλ™μœΌλ‘œ μ„ ν˜Έ λ ˆμŠ€ν† λž‘, μ˜ˆμ•½ μ‹œκ°„λŒ€, 인원 수 등을 기반으둜 μ˜ˆμ•½μ„ μ²˜λ¦¬ν•©λ‹ˆλ‹€.
    • Saved PromptsλŠ” μž‘μ—…μ˜ 제λͺ©κ³Ό λͺ…λ Ήμ–΄λ₯Ό μ§κ΄€μ μœΌλ‘œ μ„€μ •ν•  수 있게 λ„μ™€μ€λ‹ˆλ‹€.
      • μ΄λ ‡κ²Œ μ €μž₯된 μž‘μ—…μ€ Operator의 μΈν„°νŽ˜μ΄μŠ€ μƒλ‹¨μ—μ„œ μ–Έμ œλ“  μ•‘μ„ΈμŠ€ κ°€λŠ₯ν•˜λ©°, λ‹€μ–‘ν•œ μ‹œλ‚˜λ¦¬μ˜€μ—μ„œ μœ μš©ν•˜κ²Œ ν™œμš©λ  수 μžˆμŠ΅λ‹ˆλ‹€.
      • 예λ₯Ό λ“€μ–΄:
        • λ§€μ£Ό λ°˜λ³΅λ˜λŠ” μž‘μ—…(예: 정기적인 μž₯보기 λ˜λŠ” 업무 도ꡬ μ„ΈνŒ…)
        • λ³΅μž‘ν•œ μ˜ˆμ•½ ν”„λ‘œμ„ΈμŠ€ κ°„μ†Œν™”
        • κ°œμΈν™”λœ μ‡Όν•‘ λͺ©λ‘ 생성

이와 같은 μ‚¬λ‘€λŠ” Operatorκ°€ λ‹¨μˆœν•œ μž‘μ—… μžλ™ν™”λ₯Ό λ„˜μ–΄ μ‚¬μš©μž κ²½ν—˜μ„ κ°œμΈν™”ν•˜κ³ , 반볡 μž‘μ—…μ˜ νš¨μœ¨μ„±μ„ κ·ΉλŒ€ν™”ν•  수 μžˆμŒμ„ λ³΄μ—¬μ€λ‹ˆλ‹€. μž‘μ—… μ§„ν–‰ 상황은 μ‹œκ°μ μœΌλ‘œ ν‘œμ‹œλ˜λ©°, μ‚¬μš©μžλŠ” μ–Έμ œλ“  μž‘μ—…μ— κ°œμž…ν•˜κ±°λ‚˜ μˆ˜μ •ν•  수 μžˆμŠ΅λ‹ˆλ‹€.


Evaluations

CUAλŠ” μ—¬λŸ¬ λ²€μΉ˜λ§ˆν¬μ—μ„œ 이전 졜고 μ„±λŠ₯(State-of-the-Art, SOTA)을 κ°±μ‹ ν•˜λ©° λ›°μ–΄λ‚œ μ„±λŠ₯을 μž…μ¦ν–ˆμŠ΅λ‹ˆλ‹€.

이λ₯Ό 톡해 λ‹€μ–‘ν•œ λ””μ§€ν„Έ ν™˜κ²½μ—μ„œ μž‘μ—…μ„ μˆ˜ν–‰ν•  수 μžˆλŠ” λŠ₯λ ₯을 κ²€μ¦λ°›μ•˜μŠ΅λ‹ˆλ‹€.

1. OSWorld (Computer Use)

  • OSWorld λ²€μΉ˜λ§ˆν¬λŠ” CUAκ°€ Ubuntu, Windows, macOS λ“± λ‹€μ–‘ν•œ 운영체제λ₯Ό μ‘°μž‘ν•  수 μžˆλŠ” λŠ₯λ ₯을 ν‰κ°€ν•©λ‹ˆλ‹€.

이 ν‰κ°€μ—μ„œλŠ” OS μƒμ—μ„œ μˆ˜ν–‰ κ°€λŠ₯ν•œ λ‹€μ–‘ν•œ μž‘μ—…μ΄ ν¬ν•¨λ©λ‹ˆλ‹€. 예λ₯Ό λ“€μ–΄, λ‹€μŒκ³Ό 같은 μž‘μ—…λ“€μ΄ ν¬ν•¨λ©λ‹ˆλ‹€:

  • 파일 관리: 폴더 생성, 파일 이동/볡사, 파일 이름 λ³€κ²½
  • μ„€μ • μ‘°μž‘: ν™”λ©΄ 밝기 쑰절, λ„€νŠΈμ›Œν¬ μ„€μ • λ³€κ²½
  • μ• ν”Œλ¦¬μΌ€μ΄μ…˜ μ‹€ν–‰: νŠΉμ • μ•± μ‹€ν–‰ ν›„ κ°„λ‹¨ν•œ μ‘°μž‘ μˆ˜ν–‰

CUAλŠ” 기쑴의 SOTA λŒ€λΉ„ 높은 점수λ₯Ό κΈ°λ‘ν•˜λ©°, 운영 체제 μ „λ°˜μ˜ μž‘μ—…μ„ μˆ˜ν–‰ν•˜λŠ” 데 μžˆμ–΄ μœ μ—°μ„±κ³Ό μ„±λŠ₯을 μž…μ¦ν–ˆμŠ΅λ‹ˆλ‹€.

πŸ‘‰ Computer use에 λŒ€ν•œ CUA의 Inference κ²°κ³ΌλŠ” OpenAIλΈ”λ‘œκ·Έμ—μ„œ ν™•μΈν•˜μ‹€ 수 μžˆμŠ΅λ‹ˆλ‹€.


2. WebArena (Browser Use)

  • WebArenaλŠ” μ‹€μ œ μ›Ή μ‚¬μš© 사둀λ₯Ό 기반으둜 ν•˜μ—¬ CUA의 μ›Ή 탐색 및 μž‘μ—… λŠ₯λ ₯을 ν‰κ°€ν•©λ‹ˆλ‹€.

이 λ²€μΉ˜λ§ˆν¬λŠ” λ‹€μŒκ³Ό 같은 μž‘μ—… μ‹œλ‚˜λ¦¬μ˜€λ₯Ό ν¬ν•¨ν•©λ‹ˆλ‹€:

  • μ „μžμƒκ±°λž˜: νŠΉμ • μƒν’ˆμ„ κ²€μƒ‰ν•˜κ³  μž₯λ°”κ΅¬λ‹ˆμ— μΆ”κ°€ ν›„ 결제 νŽ˜μ΄μ§€κΉŒμ§€ μ§„ν–‰
  • μ½˜ν…μΈ  관리(CMS): ν…μŠ€νŠΈ μž…λ ₯, 이미지 μ—…λ‘œλ“œ, κ°„λ‹¨ν•œ μ›Ή νŽ˜μ΄μ§€ κ²Œμ‹œ
  • 포럼 ν™œλ™: κ²Œμ‹œκΈ€ μž‘μ„±, λŒ“κΈ€ μΆ”κ°€, νŠΉμ • 주제 검색

WebArenaλŠ” λ‹€μ–‘ν•œ μ›Ήμ‚¬μ΄νŠΈμ—μ„œμ˜ μƒν˜Έμž‘μš©μ„ μš”κ΅¬ν•˜λ©°, CUAκ°€ μ–Όλ§ˆλ‚˜ 잘 화면을 μ΄ν•΄ν•˜κ³  λͺ…ν™•νžˆ μž‘μ—…μ„ μˆ˜ν–‰ν•  수 μžˆλŠ”μ§€ ν‰κ°€ν•©λ‹ˆλ‹€.


3. WebVoyager (Browser Use)

  • WebVoyagerλŠ” 라이브 μ›Ήμ‚¬μ΄νŠΈμ—μ„œμ˜ μž‘μ—… λŠ₯λ ₯을 ν‰κ°€ν•˜λŠ” λ²€μΉ˜λ§ˆν¬μž…λ‹ˆλ‹€.

이 ν‰κ°€μ—μ„œλŠ” Amazon, GitHub, Google Maps λ“± 널리 μ‚¬μš©λ˜λŠ” μ›Ήμ‚¬μ΄νŠΈμ—μ„œ λ‹€μŒκ³Ό 같은 μž‘μ—…μ΄ μˆ˜ν–‰λ©λ‹ˆλ‹€:

  • Amazon: νŠΉμ • 쑰건(예: 가격 λ²”μœ„, 평점)으둜 μƒν’ˆ 검색 및 필터링
  • GitHub: 리포지토리 검색, νŠΉμ • 파일 λ‹€μš΄λ‘œλ“œ
  • Google Maps: νŠΉμ • μœ„μΉ˜ 검색, 경둜 탐색

WebVoyagerλŠ” μ‹€μ œ μ‚¬μš©μžκ°€ μ›Ήμ—μ„œ μˆ˜ν–‰ν•˜λŠ” κ³Όμ—…κ³Ό μœ μ‚¬ν•œ λ³΅μž‘ν•œ μž‘μ—…μ„ ν¬ν•¨ν•˜λ©°, CUA의 μ‹€μ œ ν™œμš© κ°€λŠ₯성을 μ§μ ‘μ μœΌλ‘œ λ³΄μ—¬μ€λ‹ˆλ‹€. 특히, 이 λ²€μΉ˜λ§ˆν¬μ—μ„œ 87%λΌλŠ” 높은 성곡λ₯ μ„ κΈ°λ‘ν•œ 것은 CUA의 μ •λ°€ν•œ μž‘μ—… 처리 λŠ₯λ ₯을 λ‚˜νƒ€λƒ…λ‹ˆλ‹€.

πŸ‘‰ Browser Use에 λŒ€ν•œ CUA의 Inference κ²°κ³ΌλŠ” OpenAIλΈ”λ‘œκ·Έμ—μ„œ ν™•μΈν•˜μ‹€ 수 μžˆμŠ΅λ‹ˆλ‹€.

μ΄λŸ¬ν•œ κ²°κ³ΌλŠ” CUAκ°€ λ‹€μ–‘ν•œ ν™˜κ²½μ—μ„œ μ‹ λ’°ν•  수 μžˆλŠ” λ„κ΅¬λ‘œ μžλ¦¬μž‘μ„ κ°€λŠ₯성을 λ³΄μ—¬μ€λ‹ˆλ‹€.

  • λ”μš±μ΄, μž‘μ—… μ‹œκ°„μ΄ μ¦κ°€ν• μˆ˜λ‘ μ„±λŠ₯이 ν–₯μƒλ˜λŠ” β€œν…ŒμŠ€νŠΈ μ‹œκ°„ μŠ€μΌ€μΌλ§β€ νš¨κ³Όλ„ κ΄€μ°°λ˜μ—ˆμŠ΅λ‹ˆλ‹€.

Operatorλ₯Ό 톡해 μ΄λŸ¬ν•œ μ„±λŠ₯은 μ‚¬μš©μž κ²½ν—˜κ³Ό κ²°ν•©ν•˜μ—¬ λ”μš± κ°•λ ₯ν•œ λ„κ΅¬λ‘œ λ°œμ „ν•˜κ³  μžˆμŠ΅λ‹ˆλ‹€.


Safety

CUAλŠ” μ‚¬μš©μžμ˜ μ•ˆμ „μ„ μ΅œμš°μ„ μœΌλ‘œ κ³ λ €ν•˜μ—¬ μ„€κ³„λ˜μ—ˆμŠ΅λ‹ˆλ‹€.

Operator와 ν•¨κ»˜ μ œκ³΅λ˜λŠ” Operator System CardλŠ” CUA의 μ•ˆμ „ κΈ°λŠ₯을 μƒμ„Ένžˆ μ„€λͺ…ν•˜λ©°, μ£Όμš” μœ„ν—˜ μš”μ†Œλ₯Ό λ‹€μŒ μ„Έ κ°€μ§€λ‘œ λΆ„λ₯˜ν•˜κ³  μžˆμŠ΅λ‹ˆλ‹€:

  1. Misuse (였용)

    • CUAλŠ” λΆˆλ²•μ μ΄κ±°λ‚˜ 규제된 μž‘μ—…μ— λŒ€ν•΄ κ±°λΆ€ν•˜λ„λ‘ ν•™μŠ΅λ˜μ—ˆμŠ΅λ‹ˆλ‹€.
    • 도박, 성인 μ½˜ν…μΈ , 무기 거래 μ‚¬μ΄νŠΈ 등은 사전 μ°¨λ‹¨λœ λΈ”λ‘λ¦¬μŠ€νŠΈμ— ν¬ν•¨λ©λ‹ˆλ‹€.
    • μ‹€μ‹œκ°„ μžλ™ν™”λœ μ•ˆμ „ 점검 및 μ‚¬μš©μž ν™œλ™ λͺ¨λ‹ˆν„°λ§μ„ 톡해 μ •μ±… μœ„λ°˜μ„ κ°μ§€ν•©λ‹ˆλ‹€.
  2. Model Mistakes (λͺ¨λΈ μ‹€μˆ˜)

    • μž‘μ—…μ„ μˆ˜ν–‰ν•˜κΈ° 전에 μ‚¬μš©μž 확인(confirmation)을 μš”μ²­ν•©λ‹ˆλ‹€.
    • 특히 λ―Όκ°ν•œ μž‘μ—…μ—λŠ” 좔가적인 확인 과정을 κ±°μΉ©λ‹ˆλ‹€.
    • 은행 κ±°λž˜μ™€ 같은 κ³ μœ„ν—˜ μž‘μ—…μ€ μ•„μ˜ˆ μˆ˜ν–‰ν•˜μ§€ μ•Šλ„λ‘ μ œν•œλ©λ‹ˆλ‹€.
    • 이메일과 같은 λ―Όκ°ν•œ μ›Ήμ‚¬μ΄νŠΈμ—μ„œλŠ” β€œWatch Mode”λ₯Ό 톡해 μ‚¬μš©μžκ°€ 직접 μž‘μ—…μ„ κ°λ…ν•˜λ„λ‘ ν•©λ‹ˆλ‹€.
  3. Adversarial Attacks (μ λŒ€μ  곡격)

    • ν”„λ‘¬ν”„νŠΈ μΈμ μ…˜, ν”Όμ‹± μ‹œλ„ 등을 νƒμ§€ν•˜κ³  μ°¨λ‹¨ν•©λ‹ˆλ‹€.
    • ν™”λ©΄μ˜ μˆ˜μƒν•œ μ½˜ν…μΈ λ₯Ό κ°μ§€ν•˜κ³  μž‘μ—…μ„ μΌμ‹œ μ€‘μ§€ν•©λ‹ˆλ‹€.

CUAλŠ” 이쀑, 삼쀑 λ°©μ–΄ ꡬ쑰λ₯Ό 톡해 μ•ˆμ „μ„±μ„ κ°•ν™”ν•˜λ©°, 지속적인 ν”Όλ“œλ°±κ³Ό κ°œμ„ μ„ 톡해 λ”μš± μ•ˆμ „ν•œ ν™˜κ²½μ„ μ œκ³΅ν•˜κ³ μž ν•©λ‹ˆλ‹€.

  • 특히, Operator λ‚΄μ—μ„œ λͺ¨λΈμ˜ λͺ¨λ“  μž‘μ—…μ€ 기둝 및 검토될 수 있으며, μ΄λŠ” 잠재적인 였λ₯˜λ‚˜ μ•…μ˜μ μΈ μ‚¬μš©μ„ λ°©μ§€ν•˜λŠ” 데 μ€‘μš”ν•œ 역할을 ν•©λ‹ˆλ‹€.
  • OperatorλŠ” μ‚¬μš©μžμ—κ²Œ μž‘μ—…μ˜ 투λͺ…성을 μ œκ³΅ν•˜λ©°, μž‘μ—… 쀑 λ°œμƒν•  수 μžˆλŠ” 였λ₯˜λ‚˜ μœ„ν—˜ μš”μ†Œλ₯Ό μ΅œμ†Œν™”ν•˜κΈ° μœ„ν•œ μ•ˆμ „ μž₯치λ₯Ό λ‹€μˆ˜ ν¬ν•¨ν•˜κ³  μžˆμŠ΅λ‹ˆλ‹€.

μ‚¬μš©μž 확인 μ‹œμŠ€ν…œκ³Ό μ‹€μ‹œκ°„ λͺ¨λ‹ˆν„°λ§, 그리고 ν•„μš”μ‹œ μ‚¬μš©μžκ°€ μ»¨νŠΈλ‘€μ„ λ„˜κ²¨λ°›μ„ 수 μžˆλŠ” κΈ°λŠ₯은 Operator와 CUAκ°€ μ•ˆμ „ν•˜κ²Œ μž‘μ—…μ„ μˆ˜ν–‰ν•  수 μžˆλ„λ‘ μ§€μ›ν•©λ‹ˆλ‹€.


Operator의 미래 전망

Operator와 CUAλŠ” λ””μ§€ν„Έ μž‘μ—… μžλ™ν™”μ˜ μƒˆλ‘œμš΄ νŒ¨λŸ¬λ‹€μž„μ„ μ œμ‹œν•˜λ©°, μ•žμœΌλ‘œλ„ μ§€μ†μ μœΌλ‘œ κ°œμ„ λ˜κ³  ν™•μž₯될 μ˜ˆμ •μž…λ‹ˆλ‹€.

  1. 개발자 지원:

    • CUAλ₯Ό API ν˜•νƒœλ‘œ μ œκ³΅ν•˜μ—¬, κ°œλ°œμžλ“€μ΄ μžμ‹ λ§Œμ˜ μ—μ΄μ „νŠΈλ₯Ό κ΅¬μΆ•ν•˜κ±°λ‚˜ κΈ°μ‘΄ μ›Œν¬ν”Œλ‘œμš°λ₯Ό μ΅œμ ν™”ν•  수 μžˆλ„λ‘ 지원할 κ³„νšμž…λ‹ˆλ‹€.
  2. ν™•μž₯된 μ ‘κ·Όμ„±:

    • ν˜„μž¬λŠ” Pro μ‚¬μš©μžμ—κ²Œλ§Œ μ œκ³΅λ˜μ§€λ§Œ, μ•žμœΌλ‘œ Plus, Team, Enterprise μ‚¬μš©μžλ₯Ό ν¬ν•¨ν•œ 더 넓은 μ‚¬μš©μžμΈ΅μœΌλ‘œ ν™•λŒ€λ  μ˜ˆμ •μž…λ‹ˆλ‹€.
  3. κ³ λ„ν™”λœ κΈ°λŠ₯:

    • Operator의 κΈ°λŠ₯을 κ³ λ„ν™”ν•˜μ—¬ 더 λ³΅μž‘ν•˜κ³  κΈ΄ μž‘μ—… 흐름을 μ²˜λ¦¬ν•  수 μžˆλ„λ‘ κ°œλ°œν•  κ²ƒμž…λ‹ˆλ‹€.

APIλŠ” μ–΄λ–€μ‹μœΌλ‘œ μ œκ³΅ν•΄μ€„μ§€ κΆκΈˆν•˜κ΅°μš” ( β€’Νˆ β—¦ β€’Νˆ )


Conclusion

CUAλŠ” λ©€ν‹°λͺ¨λ‹¬ 이해, μΆ”λ‘ , μ•ˆμ „μ„± μΈ‘λ©΄μ—μ„œ 획기적인 λ°œμ „μ„ 이룬 μ—μ΄μ „νŠΈμž…λ‹ˆλ‹€. API에 μ˜μ‘΄ν•˜μ§€ μ•Šκ³ λ„ μ‚¬λžŒμ΄ μ‚¬μš©ν•˜λŠ” 것과 λ™μΌν•œ μΈν„°νŽ˜μ΄μŠ€λ₯Ό 톡해 λ‹€μ–‘ν•œ λ””μ§€ν„Έ ν™˜κ²½μ— 적응할 수 μžˆλŠ” μœ μ—°μ„±μ„ μ œκ³΅ν•©λ‹ˆλ‹€. μ΄λŠ” AIκ°€ 인간과 ν•¨κ»˜ μž‘μ—…ν•˜λ©° 생산성과 μ°½μ˜μ„±μ„ κ·ΉλŒ€ν™”ν•  수 μžˆλŠ” μƒˆλ‘œμš΄ κ°€λŠ₯성을 μ—΄μ–΄μ€λ‹ˆλ‹€.

ν˜„μž¬ Operatorλ₯Ό 톡해 미ꡭ의 Pro Tier μ‚¬μš©μžλ“€μ—κ²Œ 연ꡬ 프리뷰 ν˜•νƒœλ‘œ 제곡되며, μ‚¬μš©μžμ˜ ν”Όλ“œλ°±μ„ 톡해 μ§€μ†μ μœΌλ‘œ κ°œμ„ λ  μ˜ˆμ •μž…λ‹ˆλ‹€. OpenAIλŠ” CUAκ°€ λ‹€μ–‘ν•œ λ””μ§€ν„Έ μž‘μ—…μ˜ β€œλ‘±ν…ŒμΌβ€μ„ ν•΄κ²°ν•˜λŠ” 데 μ€‘μš”ν•œ 도ꡬ가 될 것이라 λ―ΏμŠ΅λ‹ˆλ‹€. ν–₯ν›„ CUAλŠ” λ”μš± λ‹€μ–‘ν•œ μž‘μ—… ν™˜κ²½κ³Ό λ³΅μž‘ν•œ 문제λ₯Ό ν•΄κ²°ν•˜λ©°, AI 기술의 μƒˆλ‘œμš΄ 기쀀을 μ œμ‹œν•  κ²ƒμž…λ‹ˆλ‹€.

OperatorλŠ” λ‹¨μˆœν•œ μž‘μ—… 도ꡬ가 μ•„λ‹ˆλΌ, μ‚¬μš©μžμ˜ λ””μ§€ν„Έ ν™˜κ²½μ„ λ”μš± νŽΈλ¦¬ν•˜κ³  μ•ˆμ „ν•˜κ²Œ λ§Œλ“œλŠ” β€œνŒŒνŠΈλ„ˆβ€λ‘œ 자리 작고 μžˆμŠ΅λ‹ˆλ‹€. OpenAIλŠ” Operator와 CUAλ₯Ό 톡해 λ””μ§€ν„Έ μž‘μ—…μ˜ 미래λ₯Ό μ—΄μ–΄κ°€λ©°, AIκ°€ μ‚¬μš©μžμ™€ ν•¨κ»˜ μ„±μž₯ν•˜λŠ” μƒˆλ‘œμš΄ νŒ¨λŸ¬λ‹€μž„μ„ μ œμ‹œν•˜κ³ μž ν•©λ‹ˆλ‹€.



-->