[Paper Review] RT-DETRv2: Improved Baseline with Bag-of-Freebies for
Real-Time Detection Transformer
์๋ณธ ๊ฒ์๊ธ: https://velog.io/@euisuk-chung/Paper-Review-RT-DETRv2-Improved-Baseline-with-Bag-of-Freebies-forReal-Time-Detection-Transformer
๋ณธ ๋ฆฌ๋ทฐ๋ ์๋ฌธ์ ์ต๋ํ ์ง์ญํ ๋ด์ฉ์ ๋๋ค. ์ฌ๊ธฐ์ โ์ฐ๋ฆฌ๋โ์ ์ ์๋ฅผ ์ง์นญํฉ๋๋ค. ์ฐธ๊ณ ๋ถํ๋๋ฆฝ๋๋ค.
์ด๋ก
์ด ๋ณด๊ณ ์์์๋ ๊ฐ์ ๋ ์ค์๊ฐ Detection Transformer์ธ RT-DETRv2๋ฅผ ์ ์ํฉ๋๋ค. RT-DETRv2๋ ๊ธฐ์กด์ ์ต์ ์ค์๊ฐ detector์ธ RT-DETR์ ๊ธฐ๋ฐ์ผ๋ก ๊ตฌ์ถ๋์์ผ๋ฉฐ, ์ ์ฐ์ฑ๊ณผ ์ค์ฉ์ฑ์ ์ํ bag-of-freebies
๋ฅผ ๋์
ํ๊ณ ํ๋ จ ์ ๋ต์ ์ต์ ํํ์ฌ ํฅ์๋ ์ฑ๋ฅ์ ๋ฌ์ฑํ์ต๋๋ค.
์ ์ฐ์ฑ ๊ฐ์ ์ ์ํด, deformable attention์์ ์๋ก ๋ค๋ฅธ ์ค์ผ์ผ์ feature๋ค
์ ๋ํด ๊ฐ๊ธฐ ๋ค๋ฅธ ์์ sampling point๋ฅผ ์ค์ ํ์ฌ decoder๊ฐ ์ ํ์ multi-scale feature ์ถ์ถ์ ์ํํ ์ ์๋๋ก ์ ์ํฉ๋๋ค. ์ค์ฉ์ฑ ํฅ์์ ์ํด์๋ YOLO๋ค๊ณผ ๋น๊ตํ์ ๋ RT-DETR ํน์ ์ grid_sample operator๋ฅผ ๋์ฒดํ ์ ์๋ ์ ํ์ discrete sampling operator๋ฅผ ์ ์ํฉ๋๋ค. ์ด๋ฅผ ํตํด ์ผ๋ฐ์ ์ผ๋ก DETR๋ค๊ณผ ์ฐ๊ด๋ ๋ฐฐํฌ ์ ์ฝ์ฌํญ์ ์ ๊ฑฐํ์ต๋๋ค.
ํ๋ จ ์ ๋ต ์ธก๋ฉด์์๋ ์๋ ์์ค ์์ด ์ฑ๋ฅ์ ํฅ์์ํค๊ธฐ ์ํด dynamic data augmentation๊ณผ scale-adaptive hyperparameter ์ปค์คํฐ๋ง์ด์ง์ ์ ์ํฉ๋๋ค. ์์ค ์ฝ๋์ ์ฌ์ ํ๋ จ๋ ๋ชจ๋ธ์ https://github.com/lyuwenyu/RT-DETR์์ ์ ๊ณต๋ ์์ ์ ๋๋ค.
-
์๋ก
๊ฐ์ฒด ํ์ง(Object detection)๋ ์ด๋ฏธ์ง์์ ๊ฐ์ฒด๋ฅผ ์๋ณํ๊ณ ์์น๋ฅผ ํ์ ํ๋ ๊ธฐ๋ณธ์ ์ธ ์ปดํจํฐ ๋น์ ์์ ์ ๋๋ค. ๊ทธ ์ค์์๋ ์ค์๊ฐ ๊ฐ์ฒด ํ์ง๋ ์์จ์ฃผํ๊ณผ ๊ฐ์ ๊ด๋ฒ์ํ ์์ฉ ๋ถ์ผ๋ฅผ ๊ฐ์ง ์ค์ํ ์์ญ์ ๋๋ค. ์ง๋ ๋ช ๋ ๊ฐ์ ๋ฐ์ ์ ํตํด YOLO detector๋ค์ ์์ฌ์ ์ฌ์ง์์ด ์ด ๋ถ์ผ์์ ๊ฐ์ฅ ๊ถ์ ์๋ ํ๋ ์์ํฌ๊ฐ ๋์์ต๋๋ค. ๊ทธ ์ด์ ๋ YOLO detector๋ค์ด ๋ฌ์ฑํ ํฉ๋ฆฌ์ ์ธ ๊ท ํ(reasonable balance) ๋๋ฌธ์ ๋๋ค.
RT-DETR v1์ ๋ฑ์ฅ์ ์ค์๊ฐ ๊ฐ์ฒด ํ์ง๋ฅผ ์ํ ์๋ก์ด ๊ธฐ์ ์ ๋ฐฉํฅ์ ์ด์ด์ฃผ์์ผ๋ฉฐ, ์ด ๋ถ์ผ์์ YOLO์ ๋ํ ์์กด๋๋ฅผ ๊นจ๋จ๋ ธ์ต๋๋ค.
- RT-DETR์ DETR์ vanilla Transformer encoder๋ฅผ ๋์ฒดํ๋ ํจ์จ์ ์ธ
hybrid encoder
๋ฅผ ์ ์ํ๋๋ฐ, ์ด๋multi-scale feature
๋ค์intra-scale ์ํธ์์ฉ
๊ณผcross-scale ์ตํฉ
์ ๋ถ๋ฆฌํจ์ผ๋ก์จ ์ถ๋ก ์๋๋ฅผ ํฌ๊ฒ ํฅ์์์ผฐ์ต๋๋ค.
์ฑ๋ฅ์ ๋์ฑ ๊ฐ์ ํ๊ธฐ ์ํด RT-DETR
์ uncertainty-minimal query selection์ ์ ์ํ์ต๋๋ค.
- ์ด๋ uncertainty๋ฅผ ๋ช ์์ ์ผ๋ก ์ต์ ํํ์ฌ decoder์ ๊ณ ํ์ง์ ์ด๊ธฐ query๋ฅผ ์ ๊ณตํฉ๋๋ค.
- ๋ํ RT-DETR์ ๊ด๋ฒ์ํ detector ํฌ๊ธฐ๋ฅผ ์ ๊ณตํ๋ฉฐ ์ฌํ๋ จ ์์ด ๋ค์ํ ์ค์๊ฐ ์๋๋ฆฌ์ค์ ๋ง์ถฐ ์ ์ฐํ ์๋ ์กฐ์ ์ ์ง์ํฉ๋๋ค.
์ด ๋ณด๊ณ ์์์๋ ๊ฐ์ ๋ ์ค์๊ฐ detection Transformer์ธ RT-DETRv2
๋ฅผ ์ ์ํฉ๋๋ค.
- ์ด ์์
์ ์ต๊ทผ์ RT-DETR์ ๊ธฐ๋ฐ์ผ๋ก ๊ตฌ์ถ๋์์ผ๋ฉฐ, DETR family ๋ด์์ ์ ์ฐ์ฑ๊ณผ ์ค์ฉ์ฑ์ ์ํ
bag-of-freebies
๋ฅผ ์ ๊ณตํ๊ณ ํฅ์๋ ์ฑ๋ฅ์ ๋ฌ์ฑํ๊ธฐ ์ํด ํ๋ จ ์ ๋ต์ ์ต์ ํํ์ต๋๋ค.
๊ตฌ์ฒด์ ์ผ๋ก, RT-DETRv2๋ deformable attention module
๋ด์์ ์๋ก ๋ค๋ฅธ ์ค์ผ์ผ์ feature๋ค์ ๋ํด ๊ฐ๊ธฐ ๋ค๋ฅธ ์์ sampling point๋ฅผ ์ค์ ํ์ฌ decoder
๊ฐ ์ ํ์ multi-scale feature ์ถ์ถ์ ๋ฌ์ฑํ ๊ฒ์ ์ ์ํฉ๋๋ค.
- ์ค์ฉ์ฑ ํฅ์ ์์ญ์์ RT-DETRv2๋ DETR ํน์ ์ ๊ธฐ์กด grid_sample operator๋ฅผ ๋์ฒดํ๋ ์ ํ์ discrete sampling operator๋ฅผ ์ ๊ณตํ์ฌ detection Transformer๋ค๊ณผ ์ผ๋ฐ์ ์ผ๋ก ์ฐ๊ด๋ ๋ฐฐํฌ ์ ์ฝ์ฌํญ์ ์ ๊ฑฐํฉ๋๋ค.
๋ํ RT-DETRv2๋ ์๋ ์์ค ์์ด ์ฑ๋ฅ์ ํฅ์์ํค๋ ๋ชฉํ๋ก dynamic data augmentation
๊ณผ scale-adaptive hyperparameter ์ปค์คํฐ๋ง์ด์ง
์ ํฌํจํ ํ๋ จ ์ ๋ต์ ์ต์ ํํฉ๋๋ค.
- ๊ฒฐ๊ณผ๋ RT-DETRv2๊ฐ RT-DETR์ ์ํ bag-of-freebies์ ํจ๊ป ๊ฐ์ ๋ baseline์ ์ ๊ณตํ๊ณ , ์ ์ฐ์ฑ๊ณผ ์ค์ฉ์ฑ์ ์ฆ๊ฐ์ํค๋ฉฐ, ์ ์๋ ํ๋ จ ์ ๋ต์ด ์ฑ๋ฅ๊ณผ ํ๋ จ ๋น์ฉ์ ์ต์ ํํจ์ ๋ณด์ฌ์ค๋๋ค.
-
๋ฐฉ๋ฒ๋ก
RT-DETRv2์ ํ๋ ์์ํฌ๋ RT-DETR๊ณผ ๋์ผํ๊ฒ ์ ์ง๋๋ฉฐ, decoder์ deformable attention module์๋ง ์์ ์ฌํญ์ด ์์ต๋๋ค.
2.1 ํ๋ ์์ํฌ
์๋ก ๋ค๋ฅธ ์ค์ผ์ผ์ ๋ํ ๊ตฌ๋ณ๋ sampling point ์
ํ์ฌ DETR๋ค์ multi-scale feature๋ก ๊ตฌ์ฑ๋ ๊ธด ์ ๋ ฅ ์ํ์ค๋ก ์ธํด ๋ฐ์ํ๋ ๋์ ๊ณ์ฐ ์ค๋ฒํค๋๋ฅผ ์ํํ๊ธฐ ์ํด deformable attention module์ ํ์ฉํฉ๋๋ค.
์ฐธ๊ณ . DAT : Vision Transformer with Deformable Attention
RT-DETR์ decoder
๋ ์ด ๋ชจ๋์ ์ ์งํ๋๋ฐ, ๊ฐ ์ค์ผ์ผ์์ ๋์ผํ ์์ sampling point๋ฅผ ์ ์ํฉ๋๋ค.
์ฐ๋ฆฌ๋ ์ด๋ฌํ ์ ์ฝ์ด ์๋ก ๋ค๋ฅธ ์ค์ผ์ผ์ feature๋ค์ ๋ณธ์ง์ ์ฐจ์ด๋ฅผ ๋ฌด์ํ๊ณ deformable attention module์ feature ์ถ์ถ ๋ฅ๋ ฅ์ ์ ํํ๋ค๊ณ ์ฃผ์ฅํฉ๋๋ค.
- ๋ฐ๋ผ์ ๋ณด๋ค ์ ์ฐํ๊ณ ํจ์จ์ ์ธ feature ์ถ์ถ์ ๋ฌ์ฑํ๊ธฐ ์ํด ์๋ก ๋ค๋ฅธ ์ค์ผ์ผ์ ๋ํด ๊ตฌ๋ณ๋ ์์ sampling point๋ฅผ ์ค์ ํ ๊ฒ์ ์ ์ํฉ๋๋ค.
Discrete Sampling
RT-DETR์ ์ค์ฉ์ฑ์ ๊ฐ์ ํ๊ณ ์ด๋์๋ ์ฌ์ฉ ๊ฐ๋ฅํ๊ฒ ๋ง๋ค๊ธฐ ์ํด, ์ฐ๋ฆฌ๋ YOLO๋ค๊ณผ RT-DETR์ ๋ฐฐํฌ ์๊ตฌ์ฌํญ์ ๋น๊ตํ๋ ๋ฐ ์ด์ ์ ๋ง์ท์ต๋๋ค.
- RT-DETR ํน์ ์ grid_sample operator๊ฐ ๊ด๋ฒ์ํ ์ ์ฉ ๊ฐ๋ฅ์ฑ์ ์ ํํฉ๋๋ค.
- ๋ฐ๋ผ์
grid_sample
์ ๋์ฒดํ๋ ์ ํ์ discrete_sample operator
๋ฅผ ์ ์ํ์ฌ RT-DETR์ ๋ฐฐํฌ ์ ์ฝ์ฌํญ์ ์ ๊ฑฐํฉ๋๋ค.
(์ฐธ๊ณ )
grid_sample
operator๋ deformable attention์์ ํต์ฌ์ ์ธ ์ญํ ์ ์ํํ๋ PyTorch์ ๋ด์ฅ ํจ์์ ๋๋ค. ์ด operator๋ ์ฐ์์ ์ธ ์ขํ์์ feature๋ฅผ ์ํ๋งํ ๋ bilinear interpolation์ ์ฌ์ฉํ์ฌ ์ ํํ ๊ฐ์ ๊ณ์ฐํฉ๋๋ค.
๊ตฌ์ฒด์ ์ผ๋ก, ์์ธก๋ sampling offset์ ๋ํด ๋ฐ์ฌ๋ฆผ ์ฐ์ฐ์ ์ํํ์ฌ ์๊ฐ ์๋ชจ์ ์ธ bilinear interpolation์ ์๋ตํฉ๋๋ค. ๊ทธ๋ฌ๋ ๋ฐ์ฌ๋ฆผ ์ฐ์ฐ์ ๋ฏธ๋ถ ๋ถ๊ฐ๋ฅํ๋ฏ๋ก sampling offset ์์ธก์ ์ฌ์ฉ๋๋ ๋งค๊ฐ๋ณ์์ gradient๋ฅผ ์ฐจ๋จํฉ๋๋ค.
- (์ฐธ๊ณ ) ์ค์ ๋ก๋ ํ๋ จ์์ ๋จผ์
grid_sample
operator๋ฅผ ์ฌ์ฉํ ๋ค์discrete_sample
operator๋ก fine-tuning์ ์ํํฉ๋๋ค. ์ถ๋ก ๊ณผ ๋ฐฐํฌ์์๋ ๋ชจ๋ธ์ด discrete_sample operator๋ฅผ ์ฌ์ฉํฉ๋๋ค.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
# RT-DETR๊ณผ ๋์ผํ ํ๋ ์์ํฌ๋ฅผ ์ ์งํ๋, ๋์ฝ๋์ deformable attention ๋ชจ๋๋ง ์์
Input Image (640ร640)
โ
โโโโโโโโโโโโโโโโโโโโโโโโ
โ CNN Backbone (ResNet) โ โ CNN์ผ๋ก feature ์ถ์ถ
โ C3(80ร80) โ C4(40ร40) โ C5(20ร20)โ
โโโโโโโโโโโโโโโโโโโโโโโ
โ
โโโโโโโโโโโโโโโโโโโโโโโโ
โ Hybrid Encoder โ โ Transformer Encoder
โ Intra-scale + Cross-scale fusion โ
โโโโโโโโโโโโโโโโโโโโโโโ
โ
โโโโโโโโโโโโโโโโโโโโโโโโ
โ Transformer Decoder โ โ Deformable Attention
โ - Deformable Attention ๊ฐ์ โ
โ - Distinct sampling points โ
โ - Optional discrete sampling โ
โโโโโโโโโโโโโโโโโโโโโโโ
โ
Detection Heads
2.2 ํ๋ จ ๋ฐฉ์
Dynamic Data Augmentation
๋ชจ๋ธ์ ๊ฐ๊ฑดํ ํ์ง ์ฑ๋ฅ์ ๊ฐ์ถ๊ธฐ ์ํด dynamic data augmentation ์ ๋ต์ ์ ์ํฉ๋๋ค.
- ์ด๊ธฐ ํ๋ จ ๊ธฐ๊ฐ ๋์ detector์ ์ผ๋ฐํ ๋ฅ๋ ฅ์ด ์ข์ง ์๋ค๋ ์ ์ ๊ณ ๋ คํ์ฌ, ๋ ๊ฐํ data augmentation์ ์ ์ฉํ๊ณ ํ๊ธฐ ํ๋ จ ๊ธฐ๊ฐ์๋ ๊ทธ ์์ค์ ๋ฎ์ถฐ detector๊ฐ ๋ชฉํ ๋๋ฉ์ธ์ ํ์ง์ ์ ์ํ๋๋ก ํฉ๋๋ค.
๊ตฌ์ฒด์ ์ผ๋ก, ์ด๊ธฐ ๊ธฐ๊ฐ์๋ RT-DETR data augmentation์ ์ ์งํ๋ฉด์ ๋ง์ง๋ง ๋ epoch์์๋ RandomPhotometricDistort
, RandomZoomOut
, RandomIoUCrop
, MultiScaleInput
์ ๋นํ์ฑํํฉ๋๋ค.
Scale-adaptive Hyperparameter ์ปค์คํฐ๋ง์ด์ง
์ฐ๋ฆฌ๋ ๋ํ ์๋ก ๋ค๋ฅธ ํฌ๊ธฐ์ scaled RT-DETR๋ค์ด ๋์ผํ optimizer hyperparameter๋ก ํ๋ จ๋์ด ์ฐจ์ ์ ์ฑ๋ฅ์ ๋ณด์ธ๋ค๋ ๊ฒ์ ๊ด์ฐฐํ์ต๋๋ค. ๋ฐ๋ผ์ scaled RT-DETR๋ค์ ์ํ scale-adaptive hyperparameter ์ปค์คํฐ๋ง์ด์ง์ ์ ์ํฉ๋๋ค.
- ๊ฐ๋ฒผ์ด detector(์: ResNet18)์ ์ฌ์ ํ๋ จ๋ backbone์ด ๋ ๋ฎ์ feature ํ์ง์ ๊ฐ์ง๋ค๋ ์ ์ ๊ณ ๋ คํ์ฌ ํ์ต๋ฅ ์ ์ฆ๊ฐ์ํต๋๋ค.
- ๋ฐ๋๋ก, ํฐ detector(์: ResNet101)์ ์ฌ์ ํ๋ จ๋ backbone์ ๋ ๋์ feature ํ์ง์ ๊ฐ์ง๋ฏ๋ก ํ์ต๋ฅ ์ ๊ฐ์์ํต๋๋ค.
-
์คํ
3.1 ๊ตฌํ ์ธ๋ถ์ฌํญ
RT-DETR๊ณผ ๋ง์ฐฌ๊ฐ์ง๋ก ImageNet์์ ์ฌ์ ํ๋ จ๋ ResNet์ backbone์ผ๋ก ์ฌ์ฉํ๊ณ , batch size 16์ผ๋ก AdamW optimizer๋ฅผ ์ฌ์ฉํ์ฌ RT-DETRv2๋ฅผ ํ๋ จ์ํต๋๋ค.
- ema_decay = 0.9999์ธ exponential moving average (EMA)๋ฅผ ์ ์ฉํฉ๋๋ค.
์ ํ์ discrete sampling์ ๊ฒฝ์ฐ, ๋จผ์ grid_sample operator๋ก 6ร ์ฌ์ ํ๋ จํ ๋ค์ discrete_sample operator๋ก 1ร fine-tuning์ ์ํํฉ๋๋ค.
- Scale-adaptive hyperparameter ์ปค์คํฐ๋ง์ด์ง์ hyperparameter๋ ํ 1์ ๋์ ์์ผ๋ฉฐ, ์ฌ๊ธฐ์ lr์ ํ์ต๋ฅ ์ ๋ํ๋ ๋๋ค.
ํ 1: RT-DETRv2์ hyperparameter
3.2 ํ๊ฐ
RT-DETRv2๋ COCO train2017์์ ํ๋ จ๋๊ณ COCO val2017 dataset์์ ๊ฒ์ฆ๋ฉ๋๋ค. 0.50์์ 0.95๊น์ง 0.05 ๋จ๊ณ๋ก ๊ท ๋ฑํ๊ฒ ์ํ๋ง๋ IoU threshold์ ๋ํด ํ๊ท ํ๋ ํ์ค AP ๋ฉํธ๋ฆญ๊ณผ ์ค์ ์๋๋ฆฌ์ค์์ ์ผ๋ฐ์ ์ผ๋ก ์ฌ์ฉ๋๋ AP^val_50์ ๋ณด๊ณ ํฉ๋๋ค.
3.3 ๊ฒฐ๊ณผ
RT-DETR๊ณผ์ ๋น๊ต๋ ํ 2์ ๋์ ์์ต๋๋ค. RT-DETRv2๋ ์๋ ์์ค ์์ด ์๋ก ๋ค๋ฅธ ์ค์ผ์ผ์ detector๋ค์์ RT-DETR์ ๋ฅ๊ฐํฉ๋๋ค.
ํ 2: RT-DETR๊ณผ RT-DETRv2์ ๋น๊ต
FPS๋ TensorRT FP16์ ์ฌ์ฉํ T4 GPU์์ ๋ณด๊ณ ๋ฉ๋๋ค. ํ๊ฐ๋ฅผ ์ํด ๋ชจ๋ ์ ๋ ฅ ํฌ๊ธฐ๋ 640ร640์ผ๋ก ๊ณ ์ ๋ฉ๋๋ค.
3.4 Ablation ์ฐ๊ตฌ
Sampling Point์ ๋ํ Ablation
grid_sample operator์ ์ด sampling point ์์ ๋ํ ablation ์ฐ๊ตฌ๋ฅผ ์ํํ์ต๋๋ค.
์ด sampling point ์๋ num_head ร num_point ร num_query ร num_decoder๋ก ๊ณ์ฐ๋๋ฉฐ, ์ฌ๊ธฐ์ num_point๋ ๊ฐ ๊ทธ๋ฆฌ๋์์ ๊ฐ ์ค์ผ์ผ feature์ ๋ํ sampling point์ ํฉ์ ๋ํ๋ ๋๋ค.
- ๊ฒฐ๊ณผ๋ sampling point ์๋ฅผ ์ค์ฌ๋ ์ฑ๋ฅ์ ํฐ ์ ํ๊ฐ ์์์ ๋ณด์ฌ์ค๋๋ค(ํ 3 ์ฐธ์กฐ). ์ด๋ ๋๋ถ๋ถ์ ์ฐ์ ์๋๋ฆฌ์ค์์ ์ค์ฉ์ ์ ์ฉ์ด ์ํฅ๋ฐ์ง ์์ ๊ฒ์์ ์๋ฏธํฉ๋๋ค.
ํ 3: Sampling Point์ ๋ํ Ablation
Discrete Sampling์ ๋ํ Ablation
grid_sample์ ์ ๊ฑฐํ๊ณ discrete_sample๋ก ๋์ฒดํ๋ ablation์ ์ํํ์ต๋๋ค. ๊ฒฐ๊ณผ๋ ์ด ์์ ์ด APval50AP^val_50APval5โ0์์ ๋์ ๋๋ ๊ฐ์๋ฅผ ์ผ์ผํค์ง ์์ผ๋ฉด์ DETR๋ค์ ๋ฐฐํฌ ์ ์ฝ์ฌํญ์ ์ ๊ฑฐํจ์ ๋ณด์ฌ์ค๋๋ค(ํ 4 ์ฐธ์กฐ).
ํ 4: Discrete Sampling์ ๋ํ Ablation
-
๊ฒฐ๋ก
์ด ๋ณด๊ณ ์์์๋ ๊ฐ์ ๋ ์ค์๊ฐ detection Transformer์ธ RT-DETRv2๋ฅผ ์ ์ํ์ต๋๋ค. RT-DETRv2๋ RT-DETR์ ์ ์ฐ์ฑ๊ณผ ์ค์ฉ์ฑ์ ์ฆ๊ฐ์ํค๊ธฐ ์ํ bag-of-freebies๋ฅผ ์ ๊ณตํ๊ณ , ์๋ ์์ค ์์ด ํฅ์๋ ์ฑ๋ฅ์ ๋ฌ์ฑํ๊ธฐ ์ํด ํ๋ จ ์ ๋ต์ ์ต์ ํํฉ๋๋ค. ์ฐ๋ฆฌ๋ ์ด ๋ณด๊ณ ์๊ฐ DETR family์ ๋ํ ํต์ฐฐ์ ์ ๊ณตํ๊ณ RT-DETR ์์ฉ์ ๋ฒ์๋ฅผ ๋ํ๊ธฐ๋ฅผ ํฌ๋งํฉ๋๋ค.