[IT] LLMOpsμ RAG
μλ³Έ κ²μκΈ: https://velog.io/@euisuk-chung/IT-LLMOpsμ-RAG
μ΅κ·Ό λͺ λ κ° λκ·λͺ¨ μΈμ΄ λͺ¨λΈ(LLM)μ λ°μ μ λ€μν μ°μ μμ ν° λ³νλ₯Ό μΌμΌν€κ³ μμ΅λλ€. LLMμ μ¬λκ³Ό μ μ¬ν λ°©μμΌλ‘ ν μ€νΈλ₯Ό μμ±νκ±°λ μ§λ¬Έμ λ΅λ³ν μ μμΌλ©°, κ³ κ° μ§μ, μλ£, λ²λ₯ , μ½ν μΈ μμ± λ± μλ§μ λΆμΌμμ λ리 νμ©λκ³ μμ΅λλ€. κ·Έλ¬λ LLMμ μ±λ₯μ κ·Ήλννκ³ μ§μμ μΌλ‘ κ°μ νκΈ° μν΄μλ LLMOpsμ κ°μ 체κ³μ μΈ μ΄μ κ΄λ¦¬κ° νμμ μ λλ€.
μΆμ² : Databricks (λ§ν¬)
μ΄μ μ AIops vs MLops λΌλ λ΄μ©μ μ£Όμ λ‘ κΈμ μμ±ν μ μ΄ μμλλ°μ. κ±°κΈ°μ LLMOpsλ₯Ό μΆκ°νμλ©΄, λ€μκ³Ό κ°μ νΉμ§μ κ°μ§κ³ μμ΅λλ€:
LLMOps (Large Language Model Operations)λ λκ·λͺ¨ μΈμ΄ λͺ¨λΈ(LLM)μ κ°λ°, λ°°ν¬, κ΄λ¦¬μ νΉνλ μ΄μ λ°©μμ λλ€.
μ£Όμ νΉμ§:
- LLMμ λΌμ΄νμ¬μ΄ν΄ κ΄λ¦¬ (λ―ΈμΈ μ‘°μ λΆν° μ μ§ κ΄λ¦¬κΉμ§)
- ν둬ννΈ μμ§λμ΄λ§ λ° LLM κ΄λ¦¬
- λ°μ΄ν° λΆμ λ° μ€ν μΆμ
- LLMμ μν λ§€λμ§λ λͺ¨λΈ μ ν, λ°°ν¬, λͺ¨λν°λ§
μ°Έκ³ λ‘, μ΅κ·Όμ Foundation Modelμ΄ μΈκΈ°κ° λ§μμ§λ©΄μ, FMOpsλΌλ μ©μ΄λ κ±°λ‘ μ΄ λ§μ΄ λλλ°, κ°λ λ§ μ΄μ§ μΈκΈνκ³ λμ΄κ°κ² μ΅λλ€.
μΆμ²: Nvidia λΈλ‘κ·Έ (λ§ν¬)
FMOps (Foundation Model Operations)λ νμ΄λ°μ΄μ λͺ¨λΈμ κ°λ°, λ°°ν¬, κ΄λ¦¬, λͺ¨λν°λ§μ ν¨μ¨μ μΌλ‘ μννκΈ° μν νλ μμν¬μ νλ‘μΈμ€μ λλ€.
μ£Όμ νΉμ§:
- νμ΄λ°μ΄μ λͺ¨λΈμ μ ν λ° νκ°
- λκ·λͺ¨ λ°μ΄ν°μ κ΄λ¦¬ λ° μ μ²λ¦¬
- λͺ¨λΈ λ―ΈμΈ μ‘°μ λ° μ μ
- λΆμ° νμ΅ λ° νμ₯μ± κ΄λ¦¬
- λͺ¨λΈ λ°°ν¬ λ° μλΉ μ΅μ ν
- μ§μμ μΈ μ±λ₯ λͺ¨λν°λ§ λ° κ°μ
- λ€μν λͺ¨λ¬λ¦¬ν°(ν μ€νΈ, μ΄λ―Έμ§, μ€λμ€ λ±) μ§μ
- λ°μ΄ν° νλΌμ΄λ²μ λ° κ·μ μ€μ κ΄λ¦¬
μλλ LLMOps
/MLOps
/AIOps
μ νΉμ§μ μ’ λ νλμ λ³΄μ€ μ μκ² μ 리ν ν
μ΄λΈμ
λλ€.
νΉμ± | LLMOps | AIOps | MLOps |
---|---|---|---|
μ μ | λκ·λͺ¨ μΈμ΄ λͺ¨λΈ μ΄μ | IT μ΄μμ μν AI | λ¨Έμ λ¬λ μ΄μ |
μ£Όμ μ΄μ | λκ·λͺ¨ μΈμ΄ λͺ¨λΈ κ°λ° λ° λ°°ν¬ | IT μμ€ν λͺ¨λν°λ§ λ° μλν | μΌλ° λ¨Έμ λ¬λ λͺ¨λΈ κ°λ° λ° λ°°ν¬ |
ν΅μ¬ κΈ°μ | μμ°μ΄ μ²λ¦¬, ν둬ννΈ μμ§λμ΄λ§ | λΉ λ°μ΄ν° λΆμ, μ΄μ νμ§ | λ€μν ML μκ³ λ¦¬μ¦ λ° νλ μμν¬ |
λ°μ΄ν° μ ν | μ£Όλ‘ λκ·λͺ¨ ν μ€νΈ λ°μ΄ν° | IT μμ€ν λ‘κ·Έ λ° λ©νΈλ¦ | ꡬ쑰ν/λΉκ΅¬μ‘°ν λ°μ΄ν° |
μ£Όμ λͺ©μ | μμ°μ΄ μ΄ν΄ λ° μμ± λ₯λ ₯ ν₯μ | IT μ΄μ ν¨μ¨μ± μ¦λ | λ€μν λΉμ¦λμ€ λ¬Έμ ν΄κ²° |
νμ₯μ± κ΄λ¦¬ | λκ·λͺ¨ μΈμ΄ λͺ¨λΈ νΉν | IT μΈνλΌ μ λ° | λ€μν κ·λͺ¨μ ML λͺ¨λΈ |
μ£Όμ μμ | λͺ¨λΈ λ―ΈμΈμ‘°μ , ν둬ννΈ μ΅μ ν | λ¬Έμ μμΈ‘, κ·Όλ³Έ μμΈ λΆμ | λͺ¨λΈ νλ ¨, λ°°ν¬, λͺ¨λν°λ§ |
λꡬ μμ | Hugging Face, OpenAI API | Splunk, Datadog | MLflow, Kubeflow |
μ μ© λΆμΌ | μ±λ΄, ν μ€νΈ μμ±, λ²μ | IT μΈνλΌ κ΄λ¦¬, μλΉμ€ λ°μ€ν¬ | μμΈ‘ λΆμ, μ΄λ―Έμ§ μΈμ, μΆμ² μμ€ν |
ννΈ, RAG(Retrieval-Augmented Generation)λ LLMμ νκ³λ₯Ό 보μνλ μ€μν κΈ°μ λ‘ λ μ€λ₯΄κ³ μμ΅λλ€. RAGλ LLMμ΄ λ¨μν νμ΅λ λ°μ΄ν°λ§μ΄ μλλΌ μΈλΆμμ μ€μκ°μΌλ‘ μ 보λ₯Ό κ²μνμ¬ λ μ κ΅νκ³ μ λ’°ν μ μλ μλ΅μ μμ±ν μ μλλ‘ λμ΅λλ€.
μ΄λ² ν¬μ€νΈμμλ LLMOpsμ RAGμ μ£Όμ κ°λ , μ΄λ€μ΄ ν¨κ» μλνλ λ°©μ, κ·Έλ¦¬κ³ μ€μ μμ© μ¬λ‘λ₯Ό ν΅ν΄ μ΄λ»κ² μ΄ λ κΈ°μ μ΄ LLMμ νκ³λ₯Ό 극볡νκ³ μλ‘μ΄ κ°λ₯μ±μ μ΄μ΄κ°λμ§ μκ°νκ³ μ ν©λλ€.
-
LLMOps: λκ·λͺ¨ μΈμ΄ λͺ¨λΈ μ΄μμ λͺ¨λ κ²
LLMOpsλ λκ·λͺ¨ μΈμ΄ λͺ¨λΈμ κ°λ°, μ΄μ, λ°°ν¬, μ μ§λ³΄μμ μ΄λ₯΄λ λͺ¨λ κ³Όμ μ 체κ³μ μΌλ‘ κ΄λ¦¬νλ κ°λ μ λλ€. μ΄λ₯Ό ν΅ν΄ LLMμ μ±λ₯μ κ·Ήλννκ³ , μ€μκ°μΌλ‘ λ¬Έμ λ₯Ό ν΄κ²°νλ©°, μ§μμ μΈ λͺ¨λΈ κ°μ μ κ°λ₯νκ² ν©λλ€.
1.1 λ°μ΄ν° κ΄λ¦¬ λ° μ μ²λ¦¬
LLMμ μ±κ³΅μ νμ΅ λ°μ΄ν°μ νμ§μ ν¬κ² μ’μ°λ©λλ€. λ°λΌμ λ°μ΄ν° μμ§, μ μ , μ¦κ°μ λͺ¨λΈ κ°λ°μ 첫 λ¨κ³μμ λ§€μ° μ€μν κ³Όμ μ λλ€.
- λ°μ΄ν° μμ§: LLMμ λκ·λͺ¨μ λ°μ΄ν°λ₯Ό νμλ‘ ν©λλ€. μΉ λ¬Έμ, μ± , λ Όλ¬Έ, μμ λ―Έλμ΄ λ± λ€μν μμ€μμ λ°μ΄ν°λ₯Ό μμ§νμ¬ νμ΅μ μ¬μ©ν©λλ€.
- λ°μ΄ν° μ μ : μμ§λ λ°μ΄ν°μλ λ Έμ΄μ¦λ λΆνμν μ λ³΄κ° ν¬ν¨λ μ μμ΅λλ€. μ΄λ₯Ό μ κ±°νκ³ , μΌκ΄λ ν¬λ§·μΌλ‘ ν΅μΌνλ μμ μ΄ νμν©λλ€.
- λ°μ΄ν° μ¦κ°: νμ λ λ°μ΄ν°λ₯Ό λμ± λ€μνκ² λ§λ€κΈ° μν΄ κΈ°μ‘΄ λ°μ΄ν°λ₯Ό λ³ννκ±°λ μλ‘μ΄ λ°μ΄ν°λ₯Ό μμ±νμ¬ λͺ¨λΈμ μΌλ°ν μ±λ₯μ ν₯μμν΅λλ€.
1.2 λͺ¨λΈ κ°λ° λ° νμ΅
λ°μ΄ν°κ° μ€λΉλλ©΄ LLMμ νμ΅ λ¨κ³λ‘ λμ΄κ°λλ€. μ¬μ νμ΅(Pre-training)κ³Ό λ―ΈμΈ μ‘°μ (Fine-tuning)μ΄ μ΄ λ¨κ³μμ μ΄λ£¨μ΄μ§λλ€.
- μ¬μ νμ΅(Pre-training): LLMμ λ°©λν μμ λ°μ΄ν°λ₯Ό κΈ°λ°μΌλ‘ μΈμ΄μ κΈ°λ³Έμ μΈ μ΄ν΄ λ₯λ ₯μ νμ΅ν©λλ€. μ΄ κ³Όμ μμ λͺ¨λΈμ λ¬Έμ₯μ ꡬ쑰μ λ¨μ΄ κ°μ κ΄κ³λ₯Ό νμ νκ² λ©λλ€.
- λ―ΈμΈ μ‘°μ (Fine-tuning): νΉμ λλ©μΈμ΄λ νμ€ν¬μ λ§μΆ° λͺ¨λΈμ μ‘°μ νλ λ¨κ³μ λλ€. μλ₯Ό λ€μ΄, μλ£ λΆμΌμ νΉνλ λͺ¨λΈμ λ§λ€κΈ° μν΄ μλ£ λ Όλ¬Έμ΄λ μλ£λ‘ λͺ¨λΈμ μΆκ° νμ΅μν΅λλ€.
- ν둬ννΈ μμ§λμ΄λ§: λͺ¨λΈμ΄ μ λ ₯λ μ§λ¬Έμ λν΄ μ μ ν λ΅λ³μ λ΄λλ‘ ν둬ννΈ(μ§λ¬Έμ΄λ μ§μ)λ₯Ό μ€κ³νκ³ μ΅μ ννλ μμ μ λλ€. μ΄λ₯Ό ν΅ν΄ λͺ¨λΈμ μ±λ₯μ λμ± ν¨κ³Όμ μΌλ‘ νμ©ν μ μμ΅λλ€.
1.3 νκ° λ° κ²μ¦
λͺ¨λΈμ΄ μ±κ³΅μ μΌλ‘ νμ΅λ ν, κ·Έ μ±λ₯μ νκ°νκ³ κ²μ¦νλ κ²μ΄ μ€μν©λλ€.
- μ±λ₯ νκ°: λͺ¨λΈμ μ νλ, μΌκ΄μ±, μμ μ± λ±μ λ€μν μ§νλ₯Ό ν΅ν΄ νκ°ν©λλ€. νΉν LLMμ κ²½μ°, μμ±λ ν μ€νΈκ° λ¬Έλ²μ μΌλ‘ μ ννκ³ μλ―Έμ μΌλ‘ μΌκ΄λλμ§ νκ°νλ κ²μ΄ μ€μν©λλ€.
- νΈν₯μ± κ²μ¬: LLMμ νμ΅λ λ°μ΄ν°μ μμ‘΄νκΈ° λλ¬Έμ νΈν₯λ λ°μ΄ν°κ° ν¬ν¨λ κ²½μ° λͺ¨λΈλ νΈν₯λ λ΅λ³μ ν μ μμ΅λλ€. μ΄λ₯Ό λ°©μ§νκΈ° μν΄ μ€λ¦¬μ κ²ν μ νΈν₯μ± κ²μ¬ κ³Όμ μ κ±°μΉ©λλ€.
- A/B ν μ€νΈ: λͺ¨λΈμ μ¬λ¬ λ²μ μ λΉκ΅νμ¬ μ΅μ’ μ μΌλ‘ κ°μ₯ μ ν©ν λͺ¨λΈμ μ νν©λλ€. μ΄λ₯Ό ν΅ν΄ μ€μ μ΄μ νκ²½μμμ μ±λ₯μ 미리 μμΈ‘ν μ μμ΅λλ€.
1.4 λ°°ν¬ λ° μλΉ
λͺ¨λΈμ΄ νμ΅λκ³ κ²μ¦μ΄ μλ£λλ©΄ μ€μ μ΄μ νκ²½μ λ°°ν¬ν΄μΌ ν©λλ€.
- λͺ¨λΈ ν¨ν€μ§: νμ΅λ λͺ¨λΈμ μ΄μ νκ²½μ λ§κ² ν¨ν€μ§νκ³ , νμν κ²½μ° κ²½λννμ¬ λ°°ν¬ μ€λΉλ₯Ό ν©λλ€.
- μΈνλΌ κ΅¬μΆ: GPU μλ², λ‘λ λ°Έλ°μ λ± λκ·λͺ¨ νΈλν½κ³Ό μ°μ°μ μ²λ¦¬ν μ μλ μΈνλΌκ° νμν©λλ€. μ΄λ₯Ό ν΅ν΄ λκ·λͺ¨ μ¬μ©μκ° λμμ λͺ¨λΈμ μ¬μ©ν μ μλλ‘ ν©λλ€.
- API κ°λ°: λͺ¨λΈμ μΈλΆμμ μ½κ² μ¬μ©ν μ μλλ‘ API(Application Programming Interface)λ₯Ό κ°λ°νμ¬ μλΉμ€λ‘ μ 곡ν©λλ€.
1.5 λͺ¨λν°λ§ λ° μ μ§λ³΄μ
λ°°ν¬λ λͺ¨λΈμ μ§μμ μΌλ‘ λͺ¨λν°λ§νκ³ μ μ§λ³΄μκ° νμν©λλ€.
- μ±λ₯ λͺ¨λν°λ§: μ€μκ°μΌλ‘ λͺ¨λΈμ μ±λ₯κ³Ό μλ΅ νμ§μ λͺ¨λν°λ§ν©λλ€. λͺ¨λΈμ μλ΅ μκ°μ΄ μ§λμΉκ² κΈΈμ΄μ§κ±°λ νμ§μ΄ λ¨μ΄μ§λ©΄ μ¦κ°μ μΌλ‘ μμ ν μ μμ΅λλ€.
- νΌλλ°± μμ§: μ¬μ©μμ νΌλλ°±κ³Ό μ€λ₯ λ³΄κ³ λ₯Ό μμ§νμ¬, λͺ¨λΈμ μ§μμ μΌλ‘ κ°μ ν©λλ€.
- μ§μμ νμ΅(Continuous Learning): μλ‘μ΄ λ°μ΄ν°λ₯Ό μ§μμ μΌλ‘ λ°μνμ¬ λͺ¨λΈμ νμ΅μν€κ³ , μ΅μ νΈλ λμ μ 보μ λ§μΆ° λͺ¨λΈμ μ λ°μ΄νΈν©λλ€.
-
RAG: LLMμ μ 보 κ²μ κΈ°λ₯ κ°ν
RAG(Retrieval-Augmented Generation)λ LLMμ΄ νμ΅λ λ°μ΄ν° λ΄μμλ§ μλνλ νκ³λ₯Ό 극볡νκΈ° μν΄ μ€κ³λ νλ μμν¬μ λλ€. LLMμ΄ κΈ°μ‘΄μ νμ΅νμ§ μμ μΈλΆ λ°μ΄ν° μμ€μμ μ 보λ₯Ό κ²μν ν, μ΄λ₯Ό λ°νμΌλ‘ λ μ ννκ³ νλΆν μλ΅μ μμ±ν μ μλλ‘ ν©λλ€.
2.1 RAGμ λμ μ리
RAGλ λ κ°μ§ μ£Όμ λ¨κ³λ₯Ό ν΅ν΄ μλν©λλ€:
-
μ 보 κ²μ(Retrieval): μ¬μ©μκ° μ λ ₯ν 쿼리μ μ μ¬ν μ 보λ₯Ό λ²‘ν° λ°μ΄ν°λ² μ΄μ€μμ κ²μν©λλ€. μ΄λ 벑ν°νλ λ¬Έμμ 쿼리λ₯Ό λΉκ΅νμ¬ κ΄λ ¨μ±μ΄ λμ μ 보λ₯Ό μ°Ύμ΅λλ€.
-
μ 보 μμ±(Generation): κ²μλ μ 보μ μ¬μ©μ 쿼리λ₯Ό κ²°ν©νμ¬ LLMμ΄ μ΅μ’ ν μ€νΈλ₯Ό μμ±ν©λλ€. μ΄ κ³Όμ μμ RAGλ μΈλΆ λ°μ΄ν°λ₯Ό μ€μκ°μΌλ‘ νμ©νμ¬ λ μ νν μλ΅μ μ 곡ν μ μμ΅λλ€.
2.2 ꡬ쑰νλ λ°μ΄ν°μ λΉκ΅¬μ‘°νλ λ°μ΄ν°
RAGλ ꡬ쑰νλ λ°μ΄ν°μ λΉκ΅¬μ‘°νλ λ°μ΄ν° λͺ¨λλ₯Ό μ²λ¦¬ν μ μμΌλ©°, κ°κ°μ λ°μ΄ν° μ νμ λ§λ λ°©μμΌλ‘ μ 보λ₯Ό κ²μνκ³ μ²λ¦¬ν©λλ€.
λΉκ΅¬μ‘°νλ λ°μ΄ν°(Unstructured Data)
- μ μ: ν μ€νΈ, μ΄λ―Έμ§, μ€λμ€, λΉλμ€μ κ°μ΄ μ ν΄μ§ ꡬ쑰λ νμμ΄ μλ λ°μ΄ν°λ₯Ό λ§ν©λλ€.
- μμ: PDF νμΌ, κ΅¬κΈ λ¬Έμ, μν€ λ¬Έμ, μ΄λ―Έμ§, λΉλμ€ λ±
- μ²λ¦¬ λ°©λ²: λΉκ΅¬μ‘°νλ λ°μ΄ν°λ ν μ€νΈ μΆμΆμ΄λ μ΄λ―Έμ§ μΈμ λ±μ κ³Όμ μ κ±°μ³ κ΅¬μ‘°νλ μ λ³΄λ‘ λ³νλ©λλ€. μλ₯Ό λ€μ΄, OCR(Optical Character Recognition)μ μ¬μ©νμ¬ μ΄λ―Έμ§μμ ν μ€νΈλ₯Ό μΆμΆν μ μμ΅λλ€.
ꡬ쑰νλ λ°μ΄ν°(Structured Data)
- μ μ: μ ν΄μ§ μ€ν€λ§μ λ°λΌ μ λ ¬λ λ°μ΄ν°λ‘, μ£Όλ‘ ν μ΄λΈ ννλ‘ μ μ₯λ©λλ€.
- μμ: SQL λ°μ΄ν°λ² μ΄μ€, κ³ κ° κΈ°λ‘, κ±°λ λ΄μ λ±
- μ²λ¦¬ λ°©λ²: ꡬ쑰νλ λ°μ΄ν°λ 쿼리 μμ²μ ν΅ν΄ μ μνκ² κ²μλκ³ , νμν μ λ³΄κ° λ°νλ©λλ€.
μΆμ²: μ 보ν΅μ κΈ°μ νν μ©μ΄μ¬μ (λ§ν¬)
2.3 RAG λ°μ΄ν° νμ΄νλΌμΈ
RAG μμ€ν μμ λ°μ΄ν°λ κ²μμ΄ κ°λ₯ν νμμΌλ‘ μ μ²λ¦¬λκ³ , 벑ν°νλ ν μ μ₯λ©λλ€.
μ΄λ¬ν νμ΄νλΌμΈμ λ°μ΄ν°μ νμ§κ³Ό κ²μ μλμ ν° μν₯μ λ―ΈμΉ©λλ€.
- λ°μ΄ν° μμ§: μΈλΆ λ°μ΄ν° μμ€μμ λ¬Έμλ ν μ€νΈλ₯Ό μμ§νμ¬ μ μ₯ν©λλ€.
- λ¬Έμ μ²λ¦¬: λΉκ΅¬μ‘°νλ λ°μ΄ν°λ₯Ό ν μ€νΈλ‘ λ³ννκ³ , λ©νλ°μ΄ν°λ₯Ό μΆμΆνμ¬ κ²μμ μ©μ΄ν νμμΌλ‘ μ²λ¦¬ν©λλ€.
- μ²ν¬ λΆν λ° μλ² λ©: λκ·λͺ¨ λ¬Έμλ₯Ό μΌμ ν¬κΈ°μ μ²ν¬λ‘ λλκ³ , μ΄λ₯Ό 벑ν°ννμ¬ λ²‘ν° λ°μ΄ν°λ² μ΄μ€μ μ μ₯ν©λλ€.
- λ²‘ν° κ²μ: μ¬μ©μμ 쿼리λ 벑ν°νν ν λ²‘ν° λ°μ΄ν°λ² μ΄μ€μμ μ μ¬μ±μ κΈ°μ€μΌλ‘ κ΄λ ¨ λ¬Έμλ μ²ν¬λ₯Ό κ²μν©λλ€.
μΆμ² : Databricks (λ§ν¬)
-
RAG μμ΄μ νΈ: μ 보 κ²μκ³Ό μλ΅ μμ±μ μ°κ²°νλ μ€μΆ
RAG μμ΄μ νΈλ κ²μλ λ°μ΄ν°λ₯Ό LLMμ μ λ¬νμ¬ μ΅μ’
μλ΅μ μμ±νλ μ€μν μν μ ν©λλ€. RAG μμ΄μ νΈλ λ€μκ³Ό κ°μ λ¨κ³λ‘ μλν©λλ€:
- 쿼리 μ μ²λ¦¬: μ¬μ©μκ° μ λ ₯ν μ§λ¬Έμ΄λ μμ²μ μ μ ν νμμΌλ‘ λ³ννμ¬ λ²‘ν° λ°μ΄ν°λ² μ΄μ€μμ κ²μν μ μλλ‘ μ€λΉν©λλ€.
- 쿼리 벑ν°ν: μ¬μ©μμ 쿼리λ₯Ό 벑ν°λ‘ λ³ννκ³ , λ°μ΄ν°λ² μ΄μ€μ μ μ₯λ λ¬Έμμ μ μ¬μ±μ λΉκ΅ν©λλ€.
- μ 보 κ²μ: μ μ¬μ±μ΄ λμ μ²ν¬λ₯Ό κ²μνκ³ , μ΄λ₯Ό LLMμ μ λ ₯μΌλ‘ μ¬μ©ν©λλ€.
- ν둬ννΈ μ¦κ°: κ²μλ μ 보λ₯Ό μ¬μ©μμ μ§λ¬Έκ³Ό κ²°ν©νμ¬ LLMμ΄ μ μ ν λ΅λ³μ μμ±ν μ μλλ‘ ν둬ννΈλ₯Ό ꡬμ±ν©λλ€.
- LLM μλ΅ μμ±: LLMμ κ²μλ μ 보μ μ¬μ©μμ μμ²μ κ²°ν©νμ¬ μλ΅μ μμ±ν©λλ€.
- νμ²λ¦¬: μμ±λ μλ΅μ λΉμ¦λμ€ κ·μΉμ μ μ©νκ±°λ μΆκ°μ μΈ κ²μ¦ λ¨κ³λ₯Ό κ±°μ³ μ΅μ’ μλ΅μ μ 곡ν©λλ€.
μΆμ² : Databricks (λ§ν¬)
-
νκ° λ° λͺ¨λν°λ§: LLMOpsμ RAG μμ€ν μ μ§μμ κ°μ
RAG μμ€ν μ μ±λ₯μ μ μ§νκ³ μ§μμ μΌλ‘ κ°μ νκΈ° μν΄μλ νκ°μ λͺ¨λν°λ§μ΄ νμμ μ λλ€.
- νκ°: λͺ¨λΈμ΄ νμ΅λκ³ μ΄μλκΈ° μ , μ±λ₯ μ§νλ₯Ό νκ°νμ¬ κ°μ ν λΆλΆμ μ°Ύμλ λλ€. κ²μλ λ°μ΄ν°μ μμ±λ ν μ€νΈμ μΌκ΄μ±κ³Ό μ νμ±μ νκ°νλ κ²μ΄ μ€μν©λλ€.
- λͺ¨λν°λ§: μ΄μ νκ²½μμ μ€μκ°μΌλ‘ μ±λ₯μ λͺ¨λν°λ§νκ³ , νμμ μ¦κ°μ μΌλ‘ μ‘°μΉλ₯Ό μ·¨ν©λλ€. LLMμ΄ μμ±νλ μλ΅μ νμ§κ³Ό κ²μ μλ, λΉμ© λ±μ μΆμ ν©λλ€.
-
RAGμ LLMOpsμ μ€μ μμ© μ¬λ‘
5.1 κ³ κ° μλΉμ€ μ±λ΄
κ³ κ°μ μ§λ¬Έμ μ€μκ°μΌλ‘ κ΄λ ¨ μ 보λ₯Ό κ²μνκ³ , μ νν λ΅λ³μ μ 곡νλ μ±λ΄μ RAG κΈ°λ°μΌλ‘ ꡬνν μ μμ΅λλ€. μλ₯Ό λ€μ΄, κ³ κ°μ΄ νΉμ μ νμ λν μ 보λ₯Ό μμ²νλ©΄, RAG μμ€ν μ νμ¬ λ΄λΆμ λ§€λ΄μΌ, FAQ λ±μ κ²μνμ¬ κ³ κ°μκ² μ μ ν λ΅λ³μ μ 곡ν©λλ€.
μΆμ² : LG CNS (λ§ν¬)
5.2 λ²λ₯ λ° μλ£ λΆμΌ
RAGλ λ²λ₯ λ° μλ£ λΆμΌμμλ λ§€μ° μ μ©νκ² νμ©λ μ μμ΅λλ€. λ²λ₯ λ¬Έμλ μλ£ λ Όλ¬Έμμ κ΄λ ¨ μ 보λ₯Ό κ²μνκ³ , μ΄λ₯Ό κΈ°λ°μΌλ‘ λ²λ₯ μλ΄μ΄λ μ§λ£ μ 보λ₯Ό μ 곡ν μ μμ΅λλ€. μ΄λ RAGλ μ΅μ νλ‘λ μλ£ μ§μΉ¨μ μ€μκ°μΌλ‘ κ²μνμ¬ μ λ’°μ± μλ μ 보λ₯Ό μ 곡ν©λλ€.
μΆμ² : (λ Όλ¬Έ) How Does NLP Benefit Legal System: A Summary of Legal Artificial Intelligence?
Conclusion
LLMOpsμ RAGλ LLMμ λ³΄λ€ ν¨κ³Όμ μΌλ‘ μ΄μνκ³ , κ·Έ νκ³λ₯Ό 극볡ν μ μλ κ°λ ₯ν λꡬμ λλ€. LLMOpsλ λͺ¨λΈμ μ 체 λΌμ΄νμ¬μ΄ν΄μ κ΄λ¦¬νκ³ μ΅μ ννλ λ° νμμ μΈ μν μ νλ©°, RAGλ μΈλΆ μ 보λ₯Ό μ€μκ°μΌλ‘ κ²μνμ¬ λ μ ννκ³ μ μ©ν λ΅λ³μ μ 곡ν μ μλλ‘ λμμ€λλ€.
μ΄ λ κΈ°μ μ΄ κ²°ν©λλ©΄, κ³ κ° μλΉμ€, λ²λ₯ μλ΄, μλ£ μ 보 μ 곡 λ± λ€μν λΆμΌμμ λμ± λ°μ λ μΈκ³΅μ§λ₯ μ루μ μ μ 곡ν μ μμ΅λλ€. μμΌλ‘λ LLMOpsμ RAGλ μΈκ³΅μ§λ₯ μ΄μμ ν΅μ¬ κΈ°μ λ‘ μ리 μ‘μ, λ€μν μ°μ μ νμ μ κ°μ Έμ¬ κ²μ λλ€.
μ 첨
μλ μ£Όμ μ©μ΄λ₯Ό ν΅ν΄ κ°λ μ μ½κ² μ΄ν΄νκ³ , μ΄λ¬ν κΈ°μ λ€μ΄ λ€μν μμ© λΆμΌμμ μ΄λ»κ² μ¬μ©λ μ μλμ§ λͺ ννκ² νμ ν μ μμ΅λλ€.
1. LLM (Large Language Model)
λκ·λͺ¨ μΈμ΄ λͺ¨λΈλ‘, μμμ΅ κ°μ λ§€κ°λ³μλ₯Ό νμ΅νμ¬ μΈκ°κ³Ό μ μ¬ν ν μ€νΈλ₯Ό μμ±ν μ μλ λͺ¨λΈμ λλ€. λ²μ, μμ½, μ§λ¬Έ μλ΅ λ± λ€μν μμ°μ΄ μ²λ¦¬(NLP) νμ€ν¬μμ μ¬μ©λλ©°, OpenAIμ GPTλ Googleμ BERT κ°μ λͺ¨λΈμ΄ λνμ μ λλ€.
2. RAG (Retrieval-Augmented Generation)
RAGλ μΈλΆ λ°μ΄ν°λ² μ΄μ€μμ μ€μκ°μΌλ‘ κ΄λ ¨ μ 보λ₯Ό κ²μνκ³ , μ΄λ₯Ό λ°νμΌλ‘ LLMμ΄ λ μ νν μλ΅μ μμ±ν μ μλλ‘ λλ νλ μμν¬μ λλ€. μ΄λ LLMμ΄ νμ΅ν λ°μ΄ν° μΈμλ μ΅μ μ 보λ νΉμ λλ©μΈ μ§μμ νμ©ν μ μκ² ν΄μ€λλ€.
3. RLHF (Reinforcement Learning from Human Feedback)
RLHFλ μΈκ°μ νΌλλ°±μ λ°νμΌλ‘ λͺ¨λΈμ νμ΅μμΌ μ±λ₯μ ν₯μμν€λ κΈ°λ²μ λλ€. μ΄λ₯Ό ν΅ν΄ λͺ¨λΈμ λ μΈκ°μ μΈ λ΅λ³μ μμ±νκ±°λ, νΉμ μν©μμ λΆνμν μ€λ₯λ₯Ό μ€μΌ μ μμ΅λλ€.
4. ν둬ννΈ μ²΄μ΄λ (Prompt Chaining)
ν둬ννΈ μ²΄μ΄λμ μ¬λ¬ κ°μ ν둬ννΈλ₯Ό μμ°¨μ μΌλ‘ μ°κ²°νμ¬ λ³΅μ‘ν μμ μ λ¨κ³μ μΌλ‘ μννλ λ°©λ²μ λλ€. μ΄ κΈ°μ μ ν΅ν΄ λͺ¨λΈμ λ 볡μ‘ν λ¬Έμ λ₯Ό ν΄κ²°νκ³ , λ¨κ³μ μΈ λ Όλ¦¬μ νλ‘μΈμ€λ₯Ό λ°λ₯Ό μ μμ΅λλ€.
5. κ°λλ μΌ (Guardrails)
κ°λλ μΌμ λͺ¨λΈμ μΆλ ₯μ μ μ΄νκ³ μμ μ±μ 보μ₯νλ μ₯μΉλ‘, μ€λ¦¬μ λ¬Έμ λ₯Ό λ°©μ§νκ±°λ μλͺ»λ μλ΅μ μ ννλ μν μ ν©λλ€. μ΄λ₯Ό ν΅ν΄ λͺ¨λΈμ μΆλ ₯μ΄ λΉμ¦λμ€ κ·μΉμ΄λ κ·μ μꡬ μ¬νμ μ€μν μ μμ΅λλ€.
6. ν ν¬λμ΄μ (Tokenizer)
ν μ€νΈλ₯Ό λͺ¨λΈμ΄ μ²λ¦¬ν μ μλ μμ λ¨μμΈ βν ν°βμΌλ‘ λΆν νλ λꡬμ λλ€. λͺ¨λΈμ μ λ ₯μ ν μ€νΈμμ ν ν°μΌλ‘ λ³ννκ³ , μΆλ ₯λ ν ν°μ λ€μ ν μ€νΈλ‘ λ³ννλ κ³Όμ μμ ν΅μ¬μ μΈ μν μ ν©λλ€.
7. μλ² λ© (Embedding)
μλ² λ©μ ν μ€νΈ, μ΄λ―Έμ§, μ€λμ€ λ±μ λ°μ΄ν°λ₯Ό κ³ μ°¨μ λ²‘ν° κ³΅κ°μΌλ‘ λ³ννλ κΈ°μ μ λλ€. μ΄λ₯Ό ν΅ν΄ ν μ€νΈμ μλ―Έλ₯Ό μμΉννμ¬ λͺ¨λΈμ΄ μ²λ¦¬ν μ μλ νμμΌλ‘ λ§λ€κ³ , μ μ¬ν μλ―Έλ₯Ό κ°μ§ λ°μ΄ν°λ λ²‘ν° κ³΅κ°μμ κ°κΉμ΄ μμΉμ λμ΄κ² λ©λλ€.
8. νμΈνλ (Fine-tuning)
νμΈνλμ μ¬μ νμ΅λ LLMμ νΉμ λλ©μΈμ΄λ νμ€ν¬μ λ§κ² μΆκ°λ‘ νμ΅μν€λ κ³Όμ μ λλ€. μλ₯Ό λ€μ΄, μλ£λ λ²λ₯ κ³Ό κ°μ νΉμ λΆμΌμ νΉνλ λͺ¨λΈμ λ§λ€κΈ° μν΄ νμΈνλμ μ¬μ©ν©λλ€.
9. ν둬ννΈ μμ§λμ΄λ§ (Prompt Engineering)
ν둬ννΈ μμ§λμ΄λ§μ LLMμ ν¨κ³Όμ μΈ μ§μλ₯Ό μ£ΌκΈ° μν΄ μ λ ₯ ν μ€νΈ(ν둬ννΈ)λ₯Ό μ€κ³νκ³ μ΅μ ννλ κ³Όμ μ λλ€. μ΄ κ³Όμ μ λͺ¨λΈμ΄ μ£Όμ΄μ§ μμ μμ μ΅μμ μ±λ₯μ λ°ννλλ‘ λμμ€λλ€.
10. λ²‘ν° λ°μ΄ν°λ² μ΄μ€ (Vector Database)
λ²‘ν° λ°μ΄ν°λ² μ΄μ€λ ν μ€νΈ, μ΄λ―Έμ§, μ€λμ€ λ±μ λ°μ΄ν°λ₯Ό 벑ν°λ‘ λ³ννμ¬ μ μ₯νκ³ λΉ λ₯΄κ² κ²μν μ μλ νΉμν λ°μ΄ν°λ² μ΄μ€μ λλ€. RAG μμ€ν μμ κ²μλ μ 보λ₯Ό κΈ°λ°μΌλ‘ LLMμ΄ λμ± μ κ΅ν μλ΅μ μμ±ν μ μλλ‘ λμμ€λλ€. 벑ν°νλ λ°μ΄ν°λ μ μ¬μ±μ κΈ°μ€μΌλ‘ κ²μλλ―λ‘, λ²‘ν° λ°μ΄ν°λ² μ΄μ€λ λκ·λͺ¨ λ°μ΄ν°μμ ν¨μ¨μ μΈ κ²μμ κ°λ₯νκ² ν©λλ€.
11. μ λ‘μ·/ν¨μ· νμ΅ (Zero-shot/Few-shot Learning)
μ λ‘μ· νμ΅μ λͺ¨λΈμ΄ νΉμ νμ€ν¬μ λν΄ μΆκ° νμ΅ μμ΄ μνν μ μλ λ₯λ ₯μ μλ―Ένλ©°, ν¨μ· νμ΅μ μ μ μμ μμλ§μΌλ‘ νμ€ν¬λ₯Ό μννλ λ₯λ ₯μ μλ―Έν©λλ€. μ΄λ₯Ό ν΅ν΄ λͺ¨λΈμ μλ‘μ΄ μμ μ λν μ μλ ₯μ λμΌ μ μμ΅λλ€.
12. λͺ¨λΈ μμΆ (Model Compression)
λͺ¨λΈ μμΆμ λκ·λͺ¨ LLMμ λ μκ³ ν¨μ¨μ μΈ λͺ¨λΈλ‘ λ³ννλ κΈ°μ μ λλ€. μ΄λ λͺ¨λΈμ λ°°ν¬ λ° μ€ν μλλ₯Ό κ°μ νκ³ , μμ μ¬μ©μ μ€μ΄κΈ° μν΄ νμν©λλ€.
13. μ°μ νμ΅ (Continuous Learning)
μ°μ νμ΅μ λͺ¨λΈμ μ§μμ μΌλ‘ μ λ°μ΄νΈνμ¬ μλ‘μ΄ λ°μ΄ν°μ νΈλ λλ₯Ό λ°μνλ κ³Όμ μ λλ€. μ΄λ₯Ό ν΅ν΄ λͺ¨λΈμ μ΅μ μ 보λ₯Ό λ°μνκ³ , μκ°μ΄ μ§λ¨μ λ°λΌ μ±λ₯μ μ μ§νκ±°λ ν₯μμν¬ μ μμ΅λλ€.
14. νμ± (Parsing)
νμ±μ λ°μ΄ν°λ₯Ό λΆμνμ¬ κ΅¬μ‘°νλ νμμΌλ‘ λ³ννλ κ³Όμ μ λλ€. μμ°μ΄ μ²λ¦¬μμλ ν μ€νΈλ₯Ό λ¬Έλ²μ λ¨μλ‘ λΆμνμ¬ μλ―Έλ₯Ό νμ νκ³ , μ»΄ν¨ν° κ³Όνμμλ νλ‘κ·Έλ¨μ μμ€ μ½λλ₯Ό ꡬ문 λΆμνμ¬ μ€ν κ°λ₯ν μ½λλ‘ λ³νν©λλ€. μλ₯Ό λ€μ΄, JSON νμΌμ νμ±νμ¬ ν€-κ° μμΌλ‘ λ°μ΄ν°λ₯Ό μΆμΆνλ κ²μ΄ κ·Έ μμ λλ€.