[CS294] Deep Unsupervised Learning: Introduction
μλ³Έ κ²μκΈ: https://velog.io/@euisuk-chung/λΉμ§λ-Deep-Unsupervised-Learning-Intro
λ€μμ μλ βBerkeley CS294 κ°μβμ λν μμ½ λ° νκΈ° λ΄μ©μ μ 리ν κ²μ λλ€. νλ¦° λ΄μ©μ΄ μλ€λ©΄ λκΈ λΆνλ립λλ€ π
- Course : CS294-158 SP24 Deep Unsupervised Learning
- Instructor: Pieter Abbeel
- Lecture # : L1. Introduction
λ³Έ κ°μλ Introduction κ°μλΌ κ°μλ₯Ό λ€λ£Ήλλ€. ν΄λΉ ν¬μ€νΈλ μ κ° λ³λλ‘ μλ£ μ‘°μ¬ λ° μ 리λ₯Ό μνν΄μ μΆκ°μ μΌλ‘ μμ±ν κ²μ΄λ―λ‘, λ³Έ κ°μ λ΄μ©κ³Ό μμ΄ν©λλ€.
λ₯λ¬λ νμ΅ λ°©λ²λ‘ μ κ³μΈ΅μ λΆλ₯
λ₯λ¬λ λ°©λ²λ‘ μ ν¬κ² μ§λ(Supervised), μ€μ§λ(Semi-Supervised), λΉμ§λ(UnSupervised), κ°ννμ΅(Reinforced) learningμΌλ‘ ꡬλΆν μ μμ΅λλ€.
μΆμ²: Machine learning in the prediction of cancer therapy (λ Όλ¬Έ)
νμ§λ§, νμ€μ μ΄λ κ² μμ κ°μ΄ μλ¦ λ΅κ² 4κ°μ§μ λ²μ£Όλ‘ λ€μ΄κ°μ§ μκ³ , μλ‘μ΄ νμ΅ λ°©λ²λ‘ λ€μ΄ λ§μ΄ λμ€κΈ° μμνλ©° νλ² μ 리λ₯Ό ν΄λ³Ό νμμ±μ λκΌμ΅λλ€.
λ₯λ¬λ νμ΅ λ°©λ²λ‘ μ λ°μ΄ν° λΌλ²¨λ§ μν, νμ΅ λͺ©μ , λ°μ΄ν°μ μκ³Ό μ§, κ·Έλ¦¬κ³ λ°μ΄ν° λͺ¨λ¬λ¦¬ν°μ κ°μ λ€μν κΈ°μ€μ λ°λΌ κ³μΈ΅μ μΌλ‘ λΆλ₯ν μ μμ΅λλ€.
μ΄λ¬ν κΈ°μ€μ λ°νμΌλ‘ μ¬κ΅¬μ±λ νμ΅ λ°©λ²λ‘ μ κ³μΈ΅μ λΆλ₯λ₯Ό ν΄λ³Ό μ μμ΅λλ€.
1. λ°μ΄ν° λΌλ²¨λ§ μνμ λ°λ₯Έ λΆλ₯
-
1.1 λΌλ²¨μ΄ μλ κ²½μ°
- Supervised Learning (μ§λ νμ΅): μμ ν λΌλ²¨λ§ λ°μ΄ν°λ₯Ό μ¬μ©νμ¬ νμ΅.
- Weakly Supervised Learning (μ½μ§λ νμ΅): λΆμμ νκ±°λ λΆμ νν λΌλ²¨μ μ¬μ©νμ¬ νμ΅.
- Semi-Supervised Learning (μ€μ§λ νμ΅): μΌλΆ λΌλ²¨λ§λ λ°μ΄ν°μ λΉλΌλ²¨λ§λ λ°μ΄ν°λ₯Ό ν¨κ» μ¬μ©νμ¬ νμ΅.
-
1.2 λΌλ²¨μ΄ μλ κ²½μ°
- Unsupervised Learning (λΉμ§λ νμ΅): λΌλ²¨ μμ΄ λ°μ΄ν°μ ν¨ν΄μ΄λ ꡬ쑰λ₯Ό νμ΅.
- Self-Supervised Learning (μκΈ° μ§λ νμ΅): λ°μ΄ν° μ체μμ λΌλ²¨μ μμ±νμ¬ νμ΅.
2. νμ΅ λͺ©μ μ λ°λ₯Έ λΆλ₯
- 2.1 νΉμ μμ
μ μ±λ₯ ν₯μ
- Transfer Learning (μ μ΄ νμ΅): λ€λ₯Έ μμ μμ νμ΅ν λͺ¨λΈμ μλ‘μ΄ μμ μ μ μ©νμ¬ νμ΅.
- Multi-task Learning (λ€μ€ κ³Όμ νμ΅): μ¬λ¬ μμ μ λμμ νμ΅νμ¬ μ±λ₯μ ν₯μμν΄.
- Multi-modal Learning (λ€μ€ λͺ¨λ¬ νμ΅): μλ‘ λ€λ₯Έ λ°μ΄ν° λͺ¨λ¬λ¦¬ν°λ₯Ό κ²°ν©νμ¬ λ νλΆν ννκ³Ό μ±λ₯μ μ»μ.
- 2.2 μλ‘μ΄ μν©μ λν μ μ
- Reinforcement Learning (κ°ν νμ΅): 보μμ μ΅λννλ λ°©ν₯μΌλ‘ νμ΅.
- Continual Learning (μ°μ νμ΅): μλ‘μ΄ λ°μ΄ν°λ₯Ό νμ΅νλ©΄μ μ΄μ μ νμ΅ν λ΄μ©μ μ μ§.
- Meta Learning (λ©ν νμ΅): λ€μν μμ μ νμ΅νλ©΄μ μλ‘μ΄ μμ μ λΉ λ₯΄κ² νμ΅ν μ μλ λ₯λ ₯ κ°λ°.
3. λ°μ΄ν°μ μκ³Ό μ§μ λ°λ₯Έ λΆλ₯
-
3.1 λ°μ΄ν°κ° μ μ κ²½μ°
- Zero-shot Learning (μ λ‘μ· νμ΅): νμ΅ μ λ³΄μ§ λͺ»ν ν΄λμ€λ₯Ό μμΈ‘.
- One-shot Learning (μμ· νμ΅): ν κ°μ§ μν λ°μ΄ν°λ‘λ§ νμ΅ κ°λ₯.
- Few-shot Learning (μλ νμ΅): λ§€μ° μ μ μμ λ°μ΄ν°λ‘λ νμ΅ κ°λ₯.
-
3.2 λ°μ΄ν° μ¦κ° λ° λμ‘° νμ΅
- Data Augmentation (λ°μ΄ν° μ¦κ°): κΈ°μ‘΄ λ°μ΄ν°λ₯Ό λ³ννμ¬ λ°μ΄ν°μ μ νμ₯.
- Contrastive Learning (λμ‘° νμ΅): λ°μ΄ν° κ°μ μ μ¬μ±κ³Ό μ°¨μ΄λ₯Ό νμ΅νμ¬ μ€λͺ λ ₯ κ°ν.
-
λ°μ΄ν° λΌλ²¨λ§ μνμ λ°λ₯Έ λΆλ₯
1.1 λΌλ²¨μ΄ μλ κ²½μ°
1.1.1 Supervised Learning (μ§λ νμ΅)
-
μ μ: Supervised Learningμ μ£Όμ΄μ§ μ λ ₯ λ°μ΄ν°μ λν μ λ΅(λΌλ²¨)μ΄ μλ μνμμ λͺ¨λΈμ νμ΅νλ λ°©λ²μ λλ€. μ λ ₯κ³Ό μΆλ ₯ μμ ν΅ν΄ νμ΅νλ©°, λͺ¨λΈμ μλ‘μ΄ μ λ ₯μ λν΄ μ¬λ°λ₯Έ μΆλ ₯μ μμΈ‘νλ κ²μ λͺ©νλ‘ ν©λλ€.
- μ¬μ© λͺ©μ : λΆλ₯(Classification), νκ·(Regression) λ¬Έμ ν΄κ²°. μ: μ΄λ©μΌ μ€νΈ νν°λ§, μ΄λ―Έμ§ μΈμ, μ§λ³ μμΈ‘.
- μ μ© λ°©λ²: λλμ λΌλ²¨λ§λ λ°μ΄ν°μ μ μ¬μ©ν΄ λͺ¨λΈμ νλ ¨ν©λλ€. κ° μ λ ₯ λ°μ΄ν°μ λν΄ μ λ΅ λΌλ²¨μ μ 곡νκ³ , λͺ¨λΈμ μ΄λ₯Ό κΈ°λ°μΌλ‘ νμ΅ν©λλ€.
- νμ΅ λ°©λ²: μμ€ ν¨μ(loss function)λ₯Ό μ΅μννλ λ°©ν₯μΌλ‘ κ²½μ¬νκ°λ²(Gradient Descent)κ³Ό κ°μ μ΅μ ν μκ³ λ¦¬μ¦μ μ¬μ©ν΄ κ°μ€μΉλ₯Ό μ λ°μ΄νΈν©λλ€.
- μ°κ΅¬ μμ: ResNetμ ImageNet λ°μ΄ν°μ μ μ¬μ©ν΄ νμ΅λ μ§λ νμ΅ λͺ¨λΈλ‘, κΉμ λ€νΈμν¬ νμ΅μ μν΄ μμ°¨ μ°κ²°(residual connections)μ λμ ν΄ μ΄λ―Έμ§ λΆλ₯ λ¬Έμ μμ λμ μ±λ₯μ 보μ¬μ£Όμμ΅λλ€.
(μΆκ°μ©μ΄) Active Learning (λ₯λ νμ΅)
- μ μ: λͺ¨λΈμ΄ κ°μ₯ μ μ©ν κ²μΌλ‘ νλ¨λλ λ°μ΄ν°λ₯Ό μ ννμ¬ λΌλ²¨λ§μ μμ²νκ³ νμ΅νλ λ°©λ²
- λ°©λ²:
- μ΄κΈ° λͺ¨λΈ νμ΅
- λΉλΌλ²¨λ§ λ°μ΄ν°μ λν λΆνμ€μ± μΈ‘μ
- κ°μ₯ λΆνμ€ν λ°μ΄ν° μ ν λ° λΌλ²¨λ§ μμ²
- μλ‘ λΌλ²¨λ§λ λ°μ΄ν°λ‘ λͺ¨λΈ μ¬νμ΅
- 2-4 κ³Όμ λ°λ³΅
1.1.2 Weakly Supervised Learning (μ½μ§λ νμ΅)
-
μ μ: Weakly Supervised Learningμ λΆμμ νκ±°λ λΆμ νν λΌλ²¨μ μ¬μ©νλ νμ΅ λ°©λ²μ λλ€. μ νν λΌλ²¨μ μ»κΈ° μ΄λ €μ΄ μν©μμ μ¬μ©λ©λλ€.
- μ¬μ© λͺ©μ : λΌλ²¨λ§ λΉμ©μ μ€μ΄κ±°λ, μ νν λΌλ²¨μ μ»κΈ° νλ κ²½μ°. μ: μ΄λ―Έμ§μμ λλ΅μ μΈ λ μ΄λΈλ§ μ 곡 κ°λ₯ν κ²½μ°.
- μ μ© λ°©λ²: ν΄λ¦¬μ€ν±, λλ©μΈ μ§μ, λ Έμ΄μ¦ λͺ¨λΈλ§ λ±μ μ¬μ©ν΄ λΆμμ ν λΌλ²¨μ 보μν©λλ€.
- νμ΅ λ°©λ²: λ€μ€ μΈμ€ν΄μ€ νμ΅(Multi-instance Learning), λ Έμ΄μ¦ λͺ¨λΈλ§ κΈ°λ²μ΄ μ£Όλ‘ μ¬μ©λ©λλ€.
- μ°κ΅¬ μμ: Deep Multiple Instance Learning(DMIL)μ λ³λ¦¬νμ μ΄λ―Έμ§ λΆμμμ λΆμμ ν λΌλ²¨μ μ²λ¦¬νλ λ° ν¨κ³Όμ μ λλ€.
(μΆκ°μ©μ΄) Weak Supervision (μ½μ§λ νμ΅)
- μ μ: μ νμ§ λλ λΆμμ ν λΌλ²¨μ μ¬μ©ν΄ νμ΅νλ λ°©λ²
- λ°©λ²:
- ν΄λ¦¬μ€ν± κ·μΉ μ¬μ©νμ¬ λΌλ²¨ μμ±
- ν¬λΌμ°λμμ±μ ν΅ν λλμ μ νμ§ λΌλ²¨ μμ§
- λ€μν μμ€μ μ½ν λΌλ²¨μ κ²°ν©νμ¬ λ κ°ν λΌλ²¨ μμ±
(μΆκ°μ©μ΄) Distant Supervision (μ격 μ§λ νμ΅)
- μ μ: μΈλΆ μ§μλ² μ΄μ€λ λ°μ΄ν°λ² μ΄μ€λ₯Ό νμ©νμ¬ μλμΌλ‘ λΌλ²¨μ μμ±νλ λ°©λ²
- λ°©λ²:
- μΈλΆ μ§μλ² μ΄μ€μ λΉλΌλ²¨λ§ λ°μ΄ν° λ§€μΉ
- λ§€μΉλ μ 보λ₯Ό λ°νμΌλ‘ λΌλ²¨ μλ μμ±
- μμ±λ λΌλ²¨λ‘ λͺ¨λΈ νμ΅
1.1.3 Semi-Supervised Learning (μ€μ§λ νμ΅)
-
μ μ: Semi-Supervised Learningμ μλμ λΌλ²¨λ§λ λ°μ΄ν°μ λλμ λΉλΌλ²¨λ§λ λ°μ΄ν°λ₯Ό ν¨κ» μ¬μ©νμ¬ νμ΅νλ λ°©λ²μ λλ€. μ΄ λ°©λ²μ λΌλ²¨λ§ λΉμ©μ μ€μ΄λ©΄μλ λμ μ±λ₯μ μ μ§ν μ μμ΅λλ€.
- μ¬μ© λͺ©μ : λλμ λΉλΌλ²¨λ§λ λ°μ΄ν°κ° μ‘΄μ¬νμ§λ§, λΌλ²¨λ§λ λ°μ΄ν°κ° λΆμ‘±ν μν©. μ: ν μ€νΈ λΆλ₯, μ΄λ―Έμ§ λΆλ₯.
- μ μ© λ°©λ²: λͺ¨λΈμ λΌλ²¨λ§λ λ°μ΄ν°λ‘ μ§λ νμ΅μ νκ³ , λΉλΌλ²¨λ§λ λ°μ΄ν°μλ λΉμ§λ νμ΅μ μ μ©ν΄ μΆκ°μ μΈ μ 보λ₯Ό μΆμΆν©λλ€.
- νμ΅ λ°©λ²: Consistency Regularization, Entropy Minimization λ± λ€μν κΈ°λ²μ μ¬μ©ν΄ μλ―Έ μλ ν¨ν΄μ νμ΅ν©λλ€.
- μ°κ΅¬ μμ: MixMatchλ λΌλ²¨λ§λ λ°μ΄ν°μ λΉλΌλ²¨λ§λ λ°μ΄ν°λ₯Ό νΌν©νμ¬ μ΄λ―Έμ§ λΆλ₯ μμ μμ λ°μ΄λ μ±λ₯μ λ°νν©λλ€.
1.2 λΌλ²¨μ΄ μλ κ²½μ°
1.2.1 Unsupervised Learning (λΉμ§λ νμ΅)
-
μ μ: Unsupervised Learningμ λΌλ²¨μ΄ μλ λ°μ΄ν°λ₯Ό μ¬μ©ν΄ λ°μ΄ν°μ μ¨κ²¨μ§ ν¨ν΄μ΄λ ꡬ쑰λ₯Ό νμ΅νλ λ°©λ²μ λλ€. λ°μ΄ν° μ체μ ꡬ쑰λ₯Ό μ΄ν΄νκ³ μ΄λ₯Ό λ°νμΌλ‘ λΆλ₯νκ±°λ λ³νν©λλ€.
- μ¬μ© λͺ©μ : κ΅°μ§ν(Clustering), μ°¨μ μΆμ(Dimensionality Reduction), λ°λ μΆμ (Density Estimation). μ: κ³ κ° μΈλΆν, μ΄μ νμ§.
- μ μ© λ°©λ²: λΌλ²¨μ΄ μλ λ°μ΄ν°λ₯Ό μ λ ₯λ°μ λ°μ΄ν° κ°μ μ μ¬μ±μ κΈ°λ°μΌλ‘ ν¨ν΄μ μ°Ύμ΅λλ€.
- νμ΅ λ°©λ²: K-means, PCA, Autoencoders λ±μ μκ³ λ¦¬μ¦μ μ¬μ©ν΄ λ°μ΄ν°μ λ΄μ¬λ ꡬ쑰λ₯Ό νμ΅ν©λλ€.
- μ°κ΅¬ μμ: Word2Vecμ λ¨μ΄ 벑ν°λ₯Ό νμ΅νκΈ° μν΄ λΉμ§λ νμ΅μ μ¬μ©ν΄ λ¨μ΄ κ°μ μ μ¬μ±μ λ²‘ν° κ³΅κ°μ λ§€νν©λλ€.
(μΆκ°μ©μ΄) Self Supervision (μκΈ° μ§λ νμ΅)
- μ μ: λ°μ΄ν° μ체μμ νμ΅ μ νΈλ₯Ό μμ±νμ¬ νμ΅νλ λ°©λ²
- λ°©λ²:
- λ°μ΄ν°μ μΌλΆλ₯Ό κ°λ¦¬κ³ λλ¨Έμ§λ‘ κ°λ €μ§ λΆλΆμ μμΈ‘νκ² νκΈ°
- μ΄λ―Έμ§ νμ κ°λ μμΈ‘νκΈ°
- λ¬Έμ₯μ λ¨μ΄ μμ μμΈ‘νκΈ°
1.2.2 Self-Supervised Learning (μκΈ° μ§λ νμ΅)
-
μ μ: Self-Supervised Learningμ λ°μ΄ν°μ μΌλΆλ₯Ό μ κ±°νκ±°λ λ³νν ν μ΄λ₯Ό 볡μνλ κ³Όμ λ₯Ό ν΅ν΄ νμ΅νλ λ°©λ²μ λλ€. λΌλ²¨ μμ΄λ νμ΅ν μ μλ κ°λ ₯ν λ°©λ²λ‘ μ λλ€.
- μ¬μ© λͺ©μ : λλμ λΉλΌλ²¨λ§λ λ°μ΄ν°λ₯Ό νμ©ν΄ μ μ©ν νν(representation)μ νμ΅. μ: ν μ€νΈ, μ΄λ―Έμ§, λΉλμ€ λ°μ΄ν°.
- μ μ© λ°©λ²: ν μ€νΈ λ°μ΄ν°μμ λ¨μ΄λ₯Ό λ§μ€νΉνκ±°λ, μ΄λ―Έμ§μ μΌλΆλ₯Ό μ κ±°νκ³ μ΄λ₯Ό 볡μνλλ‘ νμ΅ν©λλ€.
- νμ΅ λ°©λ²: BERT, SimCLR, MoCoμ κ°μ λͺ¨λΈμ μ¬μ©ν΄ λ°μ΄ν°λ₯Ό μ€μ€λ‘ λΌλ²¨λ§νμ¬ κ³ νμ§μ ννμ νμ΅ν©λλ€.
- μ°κ΅¬ μμ: BERTλ ν μ€νΈ λ°μ΄ν°μμ νΉμ λ¨μ΄λ₯Ό λ§μ€νΉνκ³ μ΄λ₯Ό μμΈ‘νλ λ°©μμΌλ‘ νμ΅λ©λλ€.
(μΆκ°μ©μ΄) Self Training (μκΈ° νλ ¨)
- μ μ: λΌλ²¨μ΄ μλ λ°μ΄ν°λ‘ νμ΅ν λͺ¨λΈμ μ¬μ©νμ¬ λΌλ²¨μ΄ μλ λ°μ΄ν°μ λν μμΈ‘μ μννκ³ , μ΄λ₯Ό μλ‘μ΄ νμ΅ λ°μ΄ν°λ‘ μ¬μ©νλ λ°©λ²
- λ°©λ²:
- λΌλ²¨μ΄ μλ λ°μ΄ν°λ‘ μ΄κΈ° λͺ¨λΈ νμ΅
- λΌλ²¨μ΄ μλ λ°μ΄ν°μ λν΄ μμΈ‘ μν
- λμ μ λ’°λμ μμΈ‘ κ²°κ³Όλ₯Ό μλ‘μ΄ λΌλ²¨λ‘ μ¬μ©
- μλ‘μ΄ λ°μ΄ν°μ μΌλ‘ λͺ¨λΈ μ¬νμ΅
- 2-4 κ³Όμ λ°λ³΅
-
νμ΅ λͺ©μ μ λ°λ₯Έ λΆλ₯
2.1 νΉμ μμ μ μ±λ₯ ν₯μ
2.1.1 Transfer Learning (μ μ΄ νμ΅)
-
μ μ: Transfer Learningμ ν μμ μμ νμ΅ν λͺ¨λΈμ λ€λ₯Έ μ μ¬ν μμ μ μ μ©νλ λ°©λ²μ λλ€. μ¬μ νμ΅λ λͺ¨λΈμ μλ‘μ΄ μμ μ λ§κ² λ―ΈμΈ μ‘°μ (fine-tuning)νμ¬ μ¬μ©ν©λλ€.
- μ¬μ© λͺ©μ : μκ·λͺ¨ λ°μ΄ν°μ μμ λμ μ±λ₯μ μ»κΈ° μν΄ μ¬μ©. μ: μ»΄ν¨ν° λΉμ , μμ°μ΄ μ²λ¦¬.
- μ μ© λ°©λ²: λκ·λͺ¨ λ°μ΄ν°μ μμ νμ΅λ λͺ¨λΈμ νμ©ν΄ νΉμ μμ μ λ§κ² μ¬νμ΅ν©λλ€.
- νμ΅ λ°©λ²: μ¬μ νμ΅λ λͺ¨λΈμ μΌλΆ κ³μΈ΅μ κ³ μ νκ±°λ, μ 체 λ€νΈμν¬λ₯Ό λ―ΈμΈ μ‘°μ ν©λλ€.
- μ°κ΅¬ μμ: ResNetμ ImageNetμμ μ¬μ νμ΅λ λͺ¨λΈλ‘, μ΄λ₯Ό λ―ΈμΈ μ‘°μ νμ¬ λ€μν μ΄λ―Έμ§ λΆλ₯ μμ μ μ μ©ν μ μμ΅λλ€.
2.1.2 Multi-task Learning (λ€μ€ κ³Όμ νμ΅)
μ μ: Multi-task Learningμ μ¬λ¬ κ΄λ ¨λ μμ μ λμμ νμ΅νλ λ°©λ²μ λλ€. μμ κ°μ κ³΅ν΅ μ 보λ₯Ό 곡μ ν¨μΌλ‘μ¨ μΌλ°ν μ±λ₯μ ν₯μμν¬ μ μμ΅λλ€.
- μ¬μ© λͺ©μ : μ¬λ¬ μμ κ°μ μλμ§λ₯Ό ν΅ν΄ μ±λ₯μ ν₯μμν€κ³ , λͺ¨λΈμ ν¨μ¨μ±μ λμ΄κΈ° μν΄ μ¬μ©. μ: μμ¨ μ£Όν, μ»΄ν¨ν° λΉμ .
- μ μ© λ°©λ²: νλμ λͺ¨λΈμ΄ μ¬λ¬ μμ μ λμμ νμ΅νλλ‘ μ€κ³ν©λλ€.
- νμ΅ λ°©λ²: νλ νλΌλ―Έν° 곡μ (Hard Parameter Sharing), μννΈ νλΌλ―Έν° 곡μ (Soft Parameter Sharing) κΈ°λ²μ μ¬μ©ν΄ μμ κ°μ κ· νμ μ μ§ν©λλ€.
- μ°κ΅¬ μμ: Uberμ Multi-task Neural Networksλ μμ¨ μ£Όν μ°¨λμμ μ¬λ¬ μμ μ λμμ μ²λ¦¬ν μ μλλ‘ μ€κ³λμμ΅λλ€.
2.1.3 Multi-modal Learning (λ€μ€ λͺ¨λ¬ νμ΅)
-
μ μ: Multi-modal Learningμ ν μ€νΈ, μ΄λ―Έμ§, μμ± λ± μ¬λ¬ κ°μ§ μλ‘ λ€λ₯Έ λ°μ΄ν° λͺ¨λ¬λ¦¬ν°λ₯Ό κ²°ν©νμ¬ νμ΅νλ λ°©λ²μ λλ€. λ€μν ννμ λ°μ΄ν°λ₯Ό ν΅ν©νμ¬ λ νλΆν ννκ³Ό μ±λ₯μ μ»λ κ²μ΄ λͺ©νμ λλ€.
- μ¬μ© λͺ©μ : μ¬λ¬ λͺ¨λ¬λ¦¬ν° κ°μ κ΄κ³λ₯Ό μ΄ν΄νκ³ , μ΄λ₯Ό ν΅ν΄ 볡ν©μ μΈ λ¬Έμ λ₯Ό ν΄κ²°νκΈ° μν΄ μ¬μ©. μ: ν μ€νΈ-μ΄λ―Έμ§ λ³ν, λΉλμ€ μ€λͺ μμ±.
- μ μ© λ°©λ²: λͺ¨λΈμ μλ‘ λ€λ₯Έ λͺ¨λ¬λ¦¬ν° κ°μ μνΈ μμ©μ νμ΅νκ³ , μ΄λ₯Ό κ²°ν©ν΄ ν΅ν©λ ννμ μμ±ν©λλ€.
- νμ΅ λ°©λ²: Cross-modal Attention, Joint Embedding, Transformer κΈ°λ° λͺ¨λΈ λ±μ΄ μ¬μ©λ©λλ€.
- μ°κ΅¬ μμ: CLIP(OpenAI)μ μ΄λ―Έμ§μ ν μ€νΈλ₯Ό λμμ νμ΅ν΄, ν μ€νΈ μ€λͺ κ³Ό μΌμΉνλ μ΄λ―Έμ§λ₯Ό μ°Ύκ±°λ, μ΄λ―Έμ§λ₯Ό μ€λͺ ν μ μλ κ°λ ₯ν λͺ¨λΈμ κ°λ°νμ΅λλ€.
2.2 μλ‘μ΄ μν©μ λν μ μ
2.2.1 Reinforcement Learning (κ°ν νμ΅)
-
μ μ: Reinforcement Learningμ μμ΄μ νΈκ° νκ²½κ³Ό μνΈμμ©νλ©°, 보μμ μ΅λννλ λ°©ν₯μΌλ‘ μ μ± μ νμ΅νλ λ°©λ²μ λλ€. μμ΄μ νΈλ νλμ μ ννκ³ , κ·Έ νλμ κ²°κ³Όλ‘λΆν° 보μμ μ»μ΅λλ€.
- μ¬μ© λͺ©μ : 볡μ‘ν μμ¬ κ²°μ λ¬Έμ , κ²μ, λ‘λ΄ μ μ΄, μμ¨ μ£Όν λ±. μ: 체μ€, λ°λ, μμ¨ μ£Όν μ°¨λ.
- μ μ© λ°©λ²: μμ΄μ νΈλ νκ²½μμ μλμ μ€λ₯(trial and error)λ₯Ό ν΅ν΄ νμ΅νλ©°, μ₯κΈ°μ μΈ λ³΄μμ μ΅λννλ λ°©ν₯μΌλ‘ μ μ± μ κ°μ ν©λλ€.
- νμ΅ λ°©λ²: Q-learning, SARSA, DQN, Policy Gradients λ±μ΄ μ¬μ©λ©λλ€.
- μ°κ΅¬ μμ: DeepMindμ AlphaGoλ μλ°±λ§ λ²μ κ²μμ ν΅ν΄ λ°λμμ μ¬λμ λ₯κ°νλ μ±λ₯μ 보μ¬μ£Όμμ΅λλ€.
2.2.2 Continual Learning (μ°μ νμ΅)
-
μ μ: Continual Learningμ λͺ¨λΈμ΄ μλ‘μ΄ λ°μ΄ν°λ μμ μ νμ΅νλ©΄μ μ΄μ μ νμ΅ν λ΄μ©μ μμ§ μλλ‘ νλ λ°©λ²μ λλ€. μ°μμ μΌλ‘ λ³ννλ νκ²½μ μ μνλ©° μ±λ₯μ μ μ§ν©λλ€.
- μ¬μ© λͺ©μ : λ³ννλ λ°μ΄ν° λΆν¬, μλ‘μ΄ μμ μ μ μ°νκ² λμνκΈ° μν΄ μ¬μ©. μ: λ‘λ΄ μ μ΄, μμ¨ μ£Όν, IoT μμ€ν .
- μ μ© λ°©λ²: λͺ¨λΈμ μλ‘μ΄ λ°μ΄ν°λ₯Ό νμ΅ν λλ§λ€ μ΄μ μ νμ΅ν λ΄μ©μ 보쑴νλ©°, μ μ§μ μΌλ‘ νμ΅ν©λλ€.
- νμ΅ λ°©λ²: EWC, GEM, Replay-based Methods λ±μ΄ μ¬μ©λ©λλ€.
- μ°κ΅¬ μμ: DeepMindμ Progress & Compressλ μ¬λ¬ μμ μ μμ°¨μ μΌλ‘ νμ΅νλ©°, μ΄μ μμ μ μ±λ₯μ μ μ§ν©λλ€.
2.2.3 Incremental Learning (μ μ§μ νμ΅)
-
μ μ: Incremental Learningμ μλ‘μ΄ λ°μ΄ν°λ ν΄λμ€κ° μΆκ°λ λ λͺ¨λΈμ μ μ§μ μΌλ‘ μ λ°μ΄νΈνλ λ°©λ²μ λλ€. μ£Όλ‘ λμΌν μμ λ΄μμ μλ‘μ΄ λ°μ΄ν°λ ν΄λμ€λ₯Ό μΆκ°νλ λ° μ€μ μ λ‘λλ€.
- μ¬μ© λͺ©μ : λͺ¨λΈμ μ 체 μ¬νμ΅ μμ΄ μλ‘μ΄ μ 보λ₯Ό ν΅ν©νκΈ° μν΄ μ¬μ©. μ: μλ‘μ΄ ν΄λμ€μ μΆκ°, λ°μ΄ν° νμ₯.
- μ μ© λ°©λ²: λͺ¨λΈμ κΈ°μ‘΄ ꡬ쑰λ₯Ό μ μ§νλ©΄μ μ μ§μ μΌλ‘ μλ‘μ΄ λ°μ΄ν°λ₯Ό ν΅ν©ν©λλ€.
- νμ΅ λ°©λ²: μλ‘μ΄ λ°μ΄ν°κ° μΆκ°λ λλ§λ€ κΈ°μ‘΄ λͺ¨λΈμ λΆλΆμ μΌλ‘ μ λ°μ΄νΈν©λλ€.
- μ°κ΅¬ μμ: μ΄λ―Έμ§ λΆλ₯ μμ μμ μλ‘μ΄ ν΄λμ€κ° μ§μμ μΌλ‘ μΆκ°λλ νκ²½μμ νμ©λ©λλ€.
2.2.4 Online Learning (μ¨λΌμΈ νμ΅)
-
μ μ: Online Learningμ λ°μ΄ν°κ° μμ°¨μ μΌλ‘ λμ°©ν λ μ€μκ°μΌλ‘ λͺ¨λΈμ μ λ°μ΄νΈνλ λ°©λ²μ λλ€. κ° λ°μ΄ν° ν¬μΈνΈμ λν΄ μ¦μ νμ΅ λ° μμΈ‘μ μνν©λλ€.
- μ¬μ© λͺ©μ : μ€μκ° λ°μ΄ν° μ²λ¦¬ λ° μ¦κ°μ μΈ λͺ¨λΈ μ λ°μ΄νΈκ° νμν κ²½μ° μ¬μ©. μ: μ€νΈλ¦¬λ° λ°μ΄ν° λΆμ, κΈμ΅ κ±°λ.
- μ μ© λ°©λ²: λ°μ΄ν°κ° μ€νΈλ¦Ό ννλ‘ μ§μμ μΌλ‘ μ μ λ λ λͺ¨λΈμ μ€μκ°μΌλ‘ νμ΅ λ° μ λ°μ΄νΈν©λλ€.
- νμ΅ λ°©λ²: κ° λ°μ΄ν° ν¬μΈνΈκ° λμ°©ν λλ§λ€ λͺ¨λΈμ μ¦μ νμ΅νκ³ μμΈ‘μ μ λ°μ΄νΈν©λλ€.
- μ°κ΅¬ μμ: μ€μκ° μ£Όκ° μμΈ‘μμ λ§€μκ° λμ°©νλ μλ‘μ΄ λ°μ΄ν°λ₯Ό λ°μν΄ λͺ¨λΈμ μ λ°μ΄νΈν©λλ€.
2.2.5 Meta Learning (λ©ν νμ΅)
-
μ μ: Meta Learningμ βνμ΅μ νμ΅νλβ λ°©λ²λ‘ μΌλ‘, μλ‘μ΄ μμ μ λΉ λ₯΄κ² νμ΅ν μ μλ λͺ¨λΈμ λ§λλ λ° μ€μ μ λ‘λλ€. λ€μν μμ μ νμ΅νλ©° μΌλ°νλ νμ΅ μ λ΅μ ν°λνλ κ²μ΄ λͺ©νμ λλ€.
- μ¬μ© λͺ©μ : μλ‘μ΄ μμ μ λν νμ΅ μλλ₯Ό λμ΄κ³ , μλμ λ°μ΄ν°λ‘λ ν¨κ³Όμ μΌλ‘ νμ΅ν μ μλλ‘ νκΈ° μν΄ μ¬μ©. μ: Few-shot Learning.
- μ μ© λ°©λ²: λͺ¨λΈμ λ€μμ μμ μ νμ΅νλ©΄μ, μλ‘μ΄ μμ μ λΉ λ₯΄κ² μ μν μ μλ λ₯λ ₯μ κ°λ°ν©λλ€.
- νμ΅ λ°©λ²: MAML, Reptile, Prototypical Networks λ±μ μκ³ λ¦¬μ¦μ΄ μ¬μ©λ©λλ€.
- μ°κ΅¬ μμ: MAML μκ³ λ¦¬μ¦μ μλ‘μ΄ μμ μ λν μ μμ±μ λμ΄λ λ©ν νμ΅ λ°©λ²μ μ 곡ν©λλ€.
-
λ°μ΄ν°μ μκ³Ό μ§μ λ°λ₯Έ λΆλ₯
3.1 λ°μ΄ν°κ° μ μ κ²½μ°
3.1.1 Zero-shot Learning (μ λ‘μ· νμ΅)
-
μ μ: Zero-shot Learningμ νμ΅μ μ¬μ©λμ§ μμ μλ‘μ΄ ν΄λμ€μ λν΄ μμΈ‘μ μννλ λ°©λ²μ λλ€. λͺ¨λΈμ΄ κΈ°μ‘΄μ μ§μκ³Ό νΉμ±μ μΌλ°ννμ¬, μ΄μ μ λ³Έ μ μλ ν΄λμ€λ₯Ό μΈμνλ κ²μ΄ λͺ©νμ λλ€.
- μ¬μ© λͺ©μ : μλ‘μ΄ ν΄λμ€μ λΌλ²¨λ§ λ°μ΄ν°κ° μ ν μμ λ μ¬μ©. μ: μλ‘μ΄ μ ν μΉ΄ν κ³ λ¦¬μ μλ λΆλ₯.
- μ μ© λ°©λ²: νμ΅ μ€μ λ³΄μ§ λͺ»ν ν΄λμ€μ μ€λͺ (μ: ν μ€νΈ μ€λͺ , μμ± λ²‘ν°)κ³Ό κΈ°μ‘΄ ν΄λμ€μ νΉμ±μ κΈ°λ°μΌλ‘ μμΈ‘ν©λλ€.
- νμ΅ λ°©λ²: Attribute-based λͺ¨λΈ, Semantic Embedding λͺ¨λΈ, Knowledge Transfer λͺ¨λΈ λ±μ΄ μ¬μ©λ©λλ€.
- μ°κ΅¬ μμ: Xian et al.μ Zero-shot Learningμ λ²€μΉλ§ν¬ λ°μ΄ν°μ μ μ μνκ³ , μλ‘μ΄ ν΄λμ€ μΈμ μ±λ₯μ νκ°νμ΅λλ€.
3.1.2 One-shot Learning (μμ· νμ΅)
-
μ μ: One-shot Learningμ μλ‘μ΄ ν΄λμ€λ₯Ό νμ΅νκΈ° μν΄ λ¨ νλμ μμ λ§μ μ¬μ©νλ νμ΅ λ°©λ²μ λλ€. Few-shot Learningμ νΉμν ννλ‘ λ³Ό μ μμ΅λλ€.
- μ¬μ© λͺ©μ : λ¨μΌ μμ λ§μΌλ‘λ μλ‘μ΄ ν΄λμ€λ₯Ό νμ΅νκ³ μμΈ‘νκΈ° μν΄ μ¬μ©. μ: μΌκ΅΄ μΈμ, μλ¬Όμ’ μΈμ.
- μ μ© λ°©λ²: μ΄μ μ νμ΅ν μ μ¬ν μμ μ μ 보λ₯Ό νμ©νμ¬, μλ‘μ΄ ν΄λμ€λ₯Ό λ¨μΌ μμ λ§μΌλ‘ νμ΅ν©λλ€.
- νμ΅ λ°©λ²: Siamese Networks, Matching Networks λ±μ΄ μ¬μ©λλ©°, λ μ λ ₯ κ°μ μ μ¬μ±μ νμ΅ν©λλ€.
- μ°κ΅¬ μμ: Vinyals et al. (2016)μ Matching Networksλ One-shot Learningμ ν΅ν΄ λ¨μΌ μμ λ§μΌλ‘ μλ‘μ΄ ν΄λμ€λ₯Ό νμ΅νλ λ° μ±κ³΅νμ΅λλ€.
3.1.3 Few-shot Learning (μλ νμ΅)
-
μ μ: Few-shot Learningμ λ§€μ° μ μ μμ νμ΅ λ°μ΄ν°λ‘λ λμ μ±λ₯μ λ°νν μ μλ λͺ¨λΈμ νμ΅νλ λ°©λ²μ λλ€. μΌλ°μ μΌλ‘ μλμ μμ (μ: 1-shot, 5-shot)λ‘ μλ‘μ΄ ν΄λμ€λ₯Ό νμ΅ν μ μλ λͺ¨λΈμ λͺ©νλ‘ ν©λλ€.
- μ¬μ© λͺ©μ : λΌλ²¨λ§λ λ°μ΄ν°κ° κ·Ήν μ μ μν©μμ μ¬μ©. μ: λλ¬Όκ² λ°μνλ μ§λ³μ μ§λ¨, λλ¬Έ 물체μ μΈμ.
- μ μ© λ°©λ²: μ΄μ μ νμ΅ν μ μ¬ν μμ μμ μ»μ κ²½νμ νμ©ν΄ μλμ λ°μ΄ν°λ₯Ό λΉ λ₯΄κ² νμ΅ν©λλ€.
- νμ΅ λ°©λ²: Prototypical Networks, Matching Networks, Relation Networks λ±μ΄ μ¬μ©λ©λλ€.
- μ°κ΅¬ μμ: Matching Networksλ μλμ νμ΅ λ°μ΄ν°λ‘λ μλ‘μ΄ ν΄λμ€μ λΉ λ₯΄κ² μ μν μ μλ Few-shot Learning λͺ¨λΈμ λλ€.
3.3 λ°μ΄ν° μ¦κ° λ° λμ‘° νμ΅
3.3.1 λ°μ΄ν° μ¦κ° (Data Augmentation)
-
μ μ: λ°μ΄ν° μ¦κ°μ νμ΅μ μ¬μ©λλ μλ³Έ λ°μ΄ν°λ₯Ό λ€μν λ°©μμΌλ‘ λ³ννμ¬ λ°μ΄ν°μ μ νμ₯νλ λ°©λ²μ λλ€. μ΄λ λͺ¨λΈμ΄ λ€μν μ λ ₯ ννμ λν΄ κ°μΈν΄μ§ μ μλλ‘ λμμ€λλ€.
- μ¬μ© λͺ©μ : λ°μ΄ν°κ° λΆμ‘±νκ±°λ λΆκ· νν μν©μμ λ°μ΄ν°μ λ€μμ±μ λμ΄κ³ , κ³Όμ ν©μ λ°©μ§νλ©° λͺ¨λΈμ μΌλ°ν μ±λ₯μ ν₯μμν€κΈ° μν΄ μ¬μ©λ©λλ€.
- μ μ© λ°©λ²: μ΄λ―Έμ§ νμ , ν¬λ‘, μμ λ³ν, μ€μΌμΌ μ‘°μ λ±κ³Ό κ°μ λ³ν κΈ°λ²μ μ μ©νμ¬ μλ‘μ΄ νμ΅ λ°μ΄ν°λ₯Ό μμ±ν©λλ€.
- νμ΅ λ°©λ²:
- μ΄λ―Έμ§ μ¦κ° κΈ°λ²: νμ , μλ₯΄κΈ°, νλ/μΆμ, μμ λ³ν, λ€μ§κΈ° λ±.
- μμ± μ¦κ° κΈ°λ²: μμ μΆκ°, μκ° μ곑, μλ λ³ν λ±.
- ν μ€νΈ μ¦κ° κΈ°λ²: λ¨μ΄ μ½μ , μμ , κ΅μ²΄, μμ λ³κ²½ λ±.
- κ³ κΈ μ¦κ° κΈ°λ²: CutMix, MixUp, CutOut λ±μ μ¬μ©ν΄ λ°μ΄ν°λ₯Ό νΌν©νκ±°λ μΌλΆλ₯Ό μ κ±°νλ λ°©μ.
- μ°κ΅¬ μμ:
- CutMix: λ μ΄λ―Έμ§λ₯Ό νΌν©νμ¬ μλ‘μ΄ νμ΅ λ°μ΄ν°λ₯Ό μμ±, λ€μν μ΄λ―Έμ§ λΆλ₯ μμ μμ μ±λ₯μ κ°μ .
- MixUp: λ μ΄λ―Έμ§λ₯Ό μ ν κ²°ν©νμ¬ μλ‘μ΄ νμ΅ μνμ λ§λ€μ΄, λͺ¨λΈμ μΌλ°ν λ₯λ ₯μ ν₯μμν΄.
- GANs κΈ°λ° μ¦κ°: StyleGAN λ±μ μλ‘μ΄ μ΄λ―Έμ§λ₯Ό μμ±ν΄ λ°μ΄ν°μ μ νμ₯νκ³ μ±λ₯μ λμ.
3.3.2 λμ‘° νμ΅ (Contrastive Learning)
-
μ μ: λμ‘° νμ΅μ νμ΅ κ³Όμ μμ λ°μ΄ν°μ μ μ¬μ±κ³Ό μ°¨μ΄λ₯Ό νμ΅νμ¬ λͺ¨λΈμ μ±λ₯μ ν₯μμν€λ λ°©λ²μ λλ€. μ΄ κΈ°λ²μ λ°μ΄ν°μ μ μ¬μ ννμ κ°μ νκ³ , νΉμ λͺ©μ μ λ§λ κ³ νμ§μ μλ² λ©μ μμ±νλ λ° μ΄μ μ λ§μΆ₯λλ€.
- μ¬μ© λͺ©μ : λ°μ΄ν° κ°μ μ μ¬μ±μ κ°μ‘°νκ³ μ°¨μ΄λ₯Ό νμ΅ν¨μΌλ‘μ¨ κ³ μ°¨μ λ°μ΄ν°μ μ μ¬ ννμ μ΅μ ννκΈ° μν΄ μ¬μ©λ©λλ€. νΉν, λ°μ΄ν°κ° 볡μ‘νκ±°λ λ€μν κ²½μ°μ μ μ©ν©λλ€.
- μ μ© λ°©λ²: λ°μ΄ν° ν¬μΈνΈ κ°μ μ μ¬μ±μ κ·Ήλννκ³ , λ€λ₯Έ λ°μ΄ν° ν¬μΈνΈμμ μ°¨μ΄λ₯Ό κ·Ήλννλ λ°©μμΌλ‘ νμ΅ν©λλ€. μ£Όλ‘ λμ‘°μ μμ€ ν¨μ(Contrastive Loss) λλ μΌμ€ ν μμ€(Triplet Loss)λ₯Ό μ¬μ©ν©λλ€.
- νμ΅ λ°©λ²:
- Contrastive Loss: μ μ¬ν λ°μ΄ν° μμ κ°κΉκ², λ€λ₯Έ λ°μ΄ν° μμ λ©λ¦¬ λ¨μ΄μ§λλ‘ νμ΅.
- Triplet Loss: μ΅μ»€(anchor) μν, μμ±(positive) μν, μμ±(negative) μν κ°μ 거리 κ΄κ³λ₯Ό μ΅μ ννμ¬ νμ΅.
- Self-Supervised Learning κΈ°λ²: SimCLR, MoCo λ±μ λμ‘° νμ΅μ ν΅ν΄ κ°λ ₯ν λ°μ΄ν° ννμ νμ΅ν¨.
- μ°κ΅¬ μμ:
- SimCLR: Self-Supervised Learningμμ λμ‘°μ μμ€μ μ¬μ©ν΄ μ΄λ―Έμ§ ννμ νμ΅νλ©°, μ§λ νμ΅ μμ΄λ κ°λ ₯ν μ±λ₯μ λ°ν.
- Triplet Loss: μΌκ΅΄ μΈμ λͺ¨λΈμμ μ μ¬ν μΌκ΅΄μ κ°κΉκ², λ€λ₯Έ μΌκ΅΄μ λ©λ¦¬ λ°°μΉλλλ‘ νμ΅ν΄ λμ μΈμ μ νλλ₯Ό λ¬μ±.
-
Unsupervised Learningμ μ€μμ±
Unsupervised Learningμ λΌλ²¨μ΄ μλ λ°μ΄ν°μμ ν¨ν΄κ³Ό ꡬ쑰λ₯Ό νμ΅νλ λ°©λ²μΌλ‘, λ°μ΄ν°μ μ¨κ²¨μ§ ꡬ쑰λ₯Ό λ°κ²¬νκ±°λ λ°μ΄ν°μ μμΆμ ν΅ν΄ λ ν¨μ¨μ μΈ λͺ¨λΈμ λ§λλ λ° μ¬μ©λ©λλ€.
1. Geoffrey Hintonμ κ΄μ
Geoffrey Hintonμ κ·Έμ 2014λ AMA(Ask Me Anything) μΈμ μμ, μΈκ°μ λκ° μ½ 101410^141014κ°μ μλ μ€λ₯Ό κ°μ§κ³ μκ³ μ°λ¦¬κ° μ½ 10910^9109μ΄λ₯Ό μ΄κΈ° λλ¬Έμ λ°μ΄ν°λ³΄λ€ ν¨μ¬ λ§μ νλΌλ―Έν°λ₯Ό κ°μ§κ³ μλ€κ³ μΈκΈνμ΅λλ€. μ΄λ μ°λ¦¬κ° λ λ§μ μμ Unsupervised Learningμ ν΄μΌ ν¨μ μλ―Έν©λλ€. κ·Έλ μΈκ°μ μ§κ° μ λ ₯(Perceptual Input)μμ μ»μ μ μλ μ μ½ μ‘°κ±΄μ μκ° λ§κΈ° λλ¬Έμ, Unsupervised Learningμ΄ νμνλ€κ³ μ€λͺ νμ΅λλ€. μ΄λ¬ν μ€λͺ μ λ°μ΄ν°μ ν¨ν΄μ νμ΅νκ³ μμΆ(Compression)νλ κ²μ΄ μΈκ°μ μ§λ₯κ³Ό μ΄λ»κ² μ°κ²°λλμ§λ₯Ό μμ¬ν©λλ€.
2. Yann LeCunμ βLeCakeβ λΉμ
Yann LeCunμ 2016λ NeurIPS ν€λ ΈνΈ κ°μ°μμ βLeCakeβ λΉμ λ₯Ό ν΅ν΄ Unsupervised Learningμ μ€μμ±μ κ°μ‘°νμ΅λλ€. κ·Έλ κ°ν νμ΅μ΄ μΌμ΄ν¬μ 체리μ ν΄λΉνκ³ , μ§λ νμ΅μ΄ μμ΄μ±μ ν΄λΉνλ λ°λ©΄, Unsupervised Learningμ μΌμ΄ν¬μ λλΆλΆμ μ°¨μ§νλ€κ³ μ€λͺ νμ΅λλ€. μ΄λ Unsupervised Learningμ΄ λ§€μ° ν° λ°μ΄ν° λ³Όλ₯¨μ μ²λ¦¬νκ³ μΌλ°νλ νμ΅μ κ°λ₯νκ² νλ ν΅μ¬ κΈ°μ μμ λνλ λλ€. LeCunμ κΈ°κ³κ° μμμ κ°μ§κ³ μΌλ°ννλ €λ©΄ μμ²λ μμ μ λ³΄κ° νμνλ©°, μ΄λ₯Ό λ¬μ±νλ λ°©λ²μ΄ λ°λ‘ Unsupervised Learningμ΄λΌκ³ κ°μ‘°νμ΅λλ€.
3. Ideal Intelligenceμ Compression
Unsupervised Learningμ λ λ€λ₯Έ μ€μν μΈ‘λ©΄μ βIdeal Intelligenceβλ‘ μ μλλ κ°λ μ λλ€. μ΄ κ°λ μ λ°λ₯΄λ©΄, μ§λ₯μ λ°μ΄ν°λ₯Ό μμΆνκ³ ν¨ν΄μ μ°Ύλ λ₯λ ₯μΌλ‘ μΈ‘μ λ μ μμ΅λλ€. Kolmogorov Complexity μ΄λ‘ μ λ°λ₯΄λ©΄, ν¨ν΄μ λͺ¨λ μ°Ύμλ΄λ κ²μ λ°μ΄ν°μ μ§§μ μ€λͺ μ μλ―Ένλ©°, μ΄λ μ΅μ μ μΆλ‘ (Optimal Inference)κ³Ό μ°κ²°λ©λλ€. μ΄λ¬ν μμΆμ ν΅ν΄ μ»μ΄μ§ μ 보λ μ΅μ μ νλμ κ²°μ νλ μΈκ³΅μ§λ₯(AI) μμ€ν μλ μ μ©λ μ μμ΅λλ€. μλ₯Ό λ€μ΄, Unsupervised Learningμ ν΅ν΄ D1 λ°μ΄ν° λΆν¬μμ μ¬μ νμ΅ν ν, D2 λ°μ΄ν° λΆν¬μμ λ―ΈμΈ μ‘°μ μ μ§ννλ©΄ λ λΉ λ₯΄κ² νμ΅ν μ μμ΅λλ€.
4. μμ© λΆμΌ
Unsupervised Learning
μ μ΄λ―Έμ§ μμ±, ν
μ€νΈ-μ΄λ―Έμ§ λ³ν, μ€λμ€ μμ±, ν
μ€νΈ μμ±, λΉλμ€ μμ± λ± λ€μν λΆμΌμμ κ°λ ₯ν μμ©λ ₯μ λ°ννκ³ μμ΅λλ€. μ€μ λ‘, Google κ²μ μμ§μ BERTμ κ°μ Unsupervised Learning λͺ¨λΈμ νμ©νμ¬ κ²μ κ²°κ³Όλ₯Ό κ°μ νμμΌλ©°, μ΄λ Unsupervised Learningμ΄ μ€μ μ°μ
μμ μ΄λ»κ² μμ° μμ€μ μν©νΈλ₯Ό μ€ μ μλμ§λ₯Ό 보μ¬μ€λλ€. BERTλ λ°©λν μμ ν
μ€νΈ λ°μ΄ν°λ₯Ό λΉμ§λ νμ΅μ ν΅ν΄ λ¨μ΄ κ°μ κ΄κ³λ₯Ό μ΄ν΄νκ³ , μ΄λ₯Ό κΈ°λ°μΌλ‘ μμ°μ΄ μ²λ¦¬ μμ
μμ νμν μ±λ₯μ λ°νν©λλ€.
Unsupervised Learningμ λ°μ΄ν°μ λΌλ²¨λ§ μμ΄λ νλΆν ν¨ν΄μ νμ΅ν μ μλ λ₯λ ₯ λλΆμ μ μ λ λ§μ μ°μ κ³Ό μ°κ΅¬ λΆμΌμμ μ€μμ±μ΄ κ°μ‘°λκ³ μμ΅λλ€. μ΄λ₯Ό ν΅ν΄ Unsupervised Learningμ κΈ°μ‘΄μ μ§λ νμ΅κ³Ό λΉκ΅ν΄ λΌλ²¨λ§μ μμ‘΄νμ§ μμΌλ©΄μλ νλΆν μ 보λ₯Ό μΆμΆν μ μμ΄, λ―Έλμ λ°μ΄ν° λΆμ λ° μΈκ³΅μ§λ₯ κΈ°μ μ ν΅μ¬μ΄ λ κ²μΌλ‘ κΈ°λλ©λλ€.
Conclusion
λ³Έ κ°μμμ μΈκΈνλ―μ΄, Unsupervised Learningμ μ€μμ±μ λ°μ΄ν°μ λΌλ²¨λ§ μμ΄λ μ¨κ²¨μ§ ν¨ν΄κ³Ό ꡬ쑰λ₯Ό νμ΅ν μ μλ€λ μ μ μμ΅λλ€. μ΄λ λκ·λͺ¨ λ°μ΄ν°μμ μ μλ―Έν μ 보λ₯Ό μΆμΆν μ μλ κ°λ ₯ν λꡬλ‘μ, λΌλ²¨λ§ λΉμ©κ³Ό μκ°μ μ κ°νλ©°, μλ‘μ΄ λλ©μΈμ΄λ μμ μ μ μνκ² μ μν μ μλ μ μ°μ±μ μ 곡ν©λλ€.
μ΄λ¬ν μ΄μ λ‘ Unsupervised Learningμ λ€μν μ°μ λ° μ°κ΅¬ λΆμΌμμ μ μ λ μ€μν μν μ λ§‘κ³ μμΌλ©°, λ―Έλμ μΈκ³΅μ§λ₯ κΈ°μ λ°μ μ νμμ μΈ μμλ‘ μ리맀κΉνκ³ μμ΅λλ€.
μμΌλ‘μ κ°μ νμ΅ λ° μ 리λ₯Ό ν΅ν΄ Unsupervised Learningμ ν΅μ¬ κ°λ κ³Ό λ€μν μμ© μ¬λ‘λ₯Ό 체κ³μ μΌλ‘ νμ΅ν¨μΌλ‘μ¨, μ΄ λ°©λ²λ‘ μ΄ μ 곡νλ κ°λ ₯ν μ μ¬λ ₯μ κΉμ΄ μ΄ν΄νκ³ , μ΄λ₯Ό μ€λ¬΄μ ν¨κ³Όμ μΌλ‘ μ μ©ν μ μλ λ₯λ ₯μ ν€μλκ°κ³ μ ν©λλ€.