Register
Login
Resources
Docs Blog Datasets Glossary Case Studies Tutorials & Webinars
Product
Data Engine LLMs Platform Enterprise
Pricing Explore
Connect to our Discord channel

index.md 10 KB

You have to be logged in to leave a comment. Sign In
comments description keywords
true Ultralyticsκ°€ μ§€μ›ν•˜λŠ” 객체 탐지, μ„ΈλΆ„ν™”, μžμ„Έ μΆ”μ •, 이미지 λΆ„λ₯˜, 닀쀑 객체 좔적을 μœ„ν•œ λ‹€μ–‘ν•œ 컴퓨터 λΉ„μ „ 데이터셋에 λŒ€ν•œ νƒμƒ‰μž…λ‹ˆλ‹€. 컴퓨터 λΉ„μ „, 데이터셋, Ultralytics, YOLO, 객체 탐지, μΈμŠ€ν„΄μŠ€ μ„ΈλΆ„ν™”, μžμ„Έ μΆ”μ •, 이미지 λΆ„λ₯˜, 닀쀑 객체 좔적

데이터셋 κ°œμš”

UltralyticsλŠ” 탐지, μΈμŠ€ν„΄μŠ€ μ„ΈλΆ„ν™”, μžμ„Έ μΆ”μ •, λΆ„λ₯˜ 및 닀쀑 객체 좔적과 같은 컴퓨터 λΉ„μ „ μž‘μ—…μ„ μ΄‰μ§„ν•˜κΈ° μœ„ν•΄ λ‹€μ–‘ν•œ 데이터셋을 μ§€μ›ν•©λ‹ˆλ‹€. μ•„λž˜λŠ” μ£Όμš” Ultralytics 데이터셋 λͺ©λ‘κ³Ό 각 컴퓨터 λΉ„μ „ μž‘μ—…μ˜ μš”μ•½, 그리고 ν•΄λ‹Ή λ°μ΄ν„°μ…‹μž…λ‹ˆλ‹€.

!!! Note "λ…ΈνŠΈ"

🚧 λ‹€κ΅­μ–΄ λ¬Έμ„œ μž‘μ—…μ€ ν˜„μž¬ μ§„ν–‰ 쀑이며, μš°λ¦¬λŠ” 이λ₯Ό κ°œμ„ ν•˜κΈ° μœ„ν•΄ λ…Έλ ₯ν•˜κ³  μžˆμŠ΅λ‹ˆλ‹€. 인내해 μ£Όμ…”μ„œ κ°μ‚¬ν•©λ‹ˆλ‹€! πŸ™

탐지 데이터셋

λ°”μš΄λ”© λ°•μŠ€ 객체 νƒμ§€λŠ” 이미지 λ‚΄ 객체듀을 νƒμ§€ν•˜κ³  각 객체 μ£Όμœ„μ— λ°”μš΄λ”© λ°•μŠ€λ₯Ό κ·Έλ € 객체λ₯Ό μœ„μΉ˜μ‹œν‚€λŠ” 컴퓨터 λΉ„μ „ κΈ°λ²•μž…λ‹ˆλ‹€.

  • Argoverse: λ„μ‹œ ν™˜κ²½μ—μ„œμ˜ 3D 좔적 및 λ™μž‘ 예츑 데이터와 ν’λΆ€ν•œ 주석이 λ‹΄κΈ΄ λ°μ΄ν„°μ…‹μž…λ‹ˆλ‹€.
  • COCO: 20λ§Œκ°œκ°€ λ„˜λŠ” λ ˆμ΄λΈ”μ΄ 뢙은 μ΄λ―Έμ§€λ‘œ μ„€κ³„λœ 객체 탐지, μ„ΈλΆ„ν™” 및 μ„€λͺ…을 μœ„ν•œ λŒ€κ·œλͺ¨ λ°μ΄ν„°μ…‹μž…λ‹ˆλ‹€.
  • COCO8: COCO train 및 COCO valμ—μ„œ 처음 4개의 이미지λ₯Ό ν¬ν•¨ν•˜μ—¬ μ‹ μ†ν•œ ν…ŒμŠ€νŠΈμ— μ ν•©ν•©λ‹ˆλ‹€.
  • Global Wheat 2020: μ „ μ„Έκ³„μ—μ„œ μˆ˜μ§‘ν•œ λ°€ 머리 μ΄λ―Έμ§€λ‘œ κ΅¬μ„±λœ 객체 탐지 및 μœ„μΉ˜ μ§€μ • μž‘μ—…μ„ μœ„ν•œ λ°μ΄ν„°μ…‹μž…λ‹ˆλ‹€.
  • Objects365: 365개 객체 μΉ΄ν…Œκ³ λ¦¬μ™€ 60λ§Œκ°œκ°€ λ„˜λŠ” 주석이 달린 이미지λ₯Ό ν¬ν•¨ν•˜λŠ” κ³ ν’ˆμ§ˆ λŒ€κ·œλͺ¨ 객체 νƒμ§€μš© λ°μ΄ν„°μ…‹μž…λ‹ˆλ‹€.
  • OpenImagesV7: κ΅¬κΈ€μ—μ„œ μ œκ³΅ν•˜λŠ” 170만개의 ν›ˆλ ¨ 이미지와 4만 2천개의 검증 이미지λ₯Ό ν¬ν•¨ν•˜λŠ” 포괄적인 λ°μ΄ν„°μ…‹μž…λ‹ˆλ‹€.
  • SKU-110K: 1만 1천 개의 이미지와 170만 개의 λ°”μš΄λ”© λ°•μŠ€λ₯Ό νŠΉμ§•μœΌλ‘œ ν•˜λŠ” μ†Œλ§€ ν™˜κ²½μ—μ„œ λ°€μ§‘λœ 객체 탐지λ₯Ό μœ„ν•œ λ°μ΄ν„°μ…‹μž…λ‹ˆλ‹€.
  • VisDrone: λ“œλ‘ μœΌλ‘œ μ΄¬μ˜ν•œ μ˜μƒμ—μ„œ 객체 탐지 및 닀쀑 객체 좔적 데이터λ₯Ό ν¬ν•¨ν•˜λŠ” λ°μ΄ν„°μ…‹μœΌλ‘œ 1만 κ°œκ°€ λ„˜λŠ” 이미지와 λΉ„λ””μ˜€ μ‹œν€€μŠ€λ₯Ό ν¬ν•¨ν•©λ‹ˆλ‹€.
  • VOC: 객체 탐지와 μ„ΈλΆ„ν™”λ₯Ό μœ„ν•œ 파슀칼 μ‹œκ° 객체 클래슀(VOC) λ°μ΄ν„°μ…‹μœΌλ‘œ 20개 객체 ν΄λž˜μŠ€μ™€ 1만 1천 κ°œκ°€ λ„˜λŠ” 이미지λ₯Ό ν¬ν•¨ν•©λ‹ˆλ‹€.
  • xView: 상곡 μ΄λ―Έμ§€μ—μ„œ 객체 탐지λ₯Ό μœ„ν•œ λ°μ΄ν„°μ…‹μœΌλ‘œ 60개 객체 μΉ΄ν…Œκ³ λ¦¬μ™€ 100만 κ°œκ°€ λ„˜λŠ” 주석이 달린 객체λ₯Ό ν¬ν•¨ν•©λ‹ˆλ‹€.

μΈμŠ€ν„΄μŠ€ μ„ΈλΆ„ν™” 데이터셋

μΈμŠ€ν„΄μŠ€ μ„ΈλΆ„ν™”λŠ” 이미지 λ‚΄ 객체듀을 ν”½μ…€ μˆ˜μ€€μ—μ„œ μ‹λ³„ν•˜κ³  μœ„μΉ˜λ₯Ό μ§€μ •ν•˜λŠ” 컴퓨터 λΉ„μ „ κΈ°λ²•μž…λ‹ˆλ‹€.

  • COCO: 객체 탐지, μ„ΈλΆ„ν™” 및 μ„€λͺ… μž‘μ—…μ„ μœ„ν•΄ μ„€κ³„λœ 20λ§Œκ°œκ°€ λ„˜λŠ” λ ˆμ΄λΈ”μ΄ 뢙은 μ΄λ―Έμ§€λ‘œ κ΅¬μ„±λœ λŒ€κ·œλͺ¨ λ°μ΄ν„°μ…‹μž…λ‹ˆλ‹€.
  • COCO8-seg: μ„ΈλΆ„ν™” 주석이 μžˆλŠ” 8개의 COCO μ΄λ―Έμ§€λ‘œ κ΅¬μ„±λœ μΈμŠ€ν„΄μŠ€ μ„ΈλΆ„ν™” μž‘μ—…μ„ μœ„ν•œ 더 μž‘μ€ λ°μ΄ν„°μ…‹μž…λ‹ˆλ‹€.

μžμ„Έ μΆ”μ •

μžμ„Έ 좔정은 카메라 λ˜λŠ” 세계 μ’Œν‘œκ³„μ— λŒ€ν•œ 객체의 μžμ„Έλ₯Ό κ²°μ •ν•˜λŠ” κΈ°μˆ μž…λ‹ˆλ‹€.

  • COCO: μžμ„Έ μΆ”μ • μž‘μ—…μ„ μœ„ν•΄ μ‚¬λžŒμ˜ μžμ„Έ 주석이 달린 λŒ€κ·œλͺ¨ λ°μ΄ν„°μ…‹μž…λ‹ˆλ‹€.
  • COCO8-pose: μΈκ°„μ˜ μžμ„Έ 주석이 ν¬ν•¨λœ 8개의 COCO μ΄λ―Έμ§€λ‘œ κ΅¬μ„±λœ μžμ„Έ μΆ”μ • μž‘μ—…μ„ μœ„ν•œ 더 μž‘μ€ λ°μ΄ν„°μ…‹μž…λ‹ˆλ‹€.
  • Tiger-pose: μžμ„Έ μΆ”μ • μž‘μ—…μ„ μœ„ν•œ ν˜Έλž‘μ΄λ₯Ό ν¬ν•¨ν•œ 263개 μ΄λ―Έμ§€λ‘œ κ΅¬μ„±λœ μ»΄νŒ©νŠΈν•œ λ°μ΄ν„°μ…‹μœΌλ‘œ, ν˜Έλž‘μ΄λ‹Ή 12개의 ν‚€ν¬μΈνŠΈκ°€ μ£Όμ„μœΌλ‘œ ν‘œμ‹œλ˜μ–΄ μžˆμŠ΅λ‹ˆλ‹€.

λΆ„λ₯˜

이미지 λΆ„λ₯˜λŠ” μ΄λ―Έμ§€μ˜ μ‹œκ°μ  λ‚΄μš©μ„ 기반으둜 이미지λ₯Ό ν•˜λ‚˜ μ΄μƒμ˜ 미리 μ •μ˜λœ ν΄λž˜μŠ€λ‚˜ μΉ΄ν…Œκ³ λ¦¬λ‘œ λΆ„λ₯˜ν•˜λŠ” 컴퓨터 λΉ„μ „ μž‘μ—…μž…λ‹ˆλ‹€.

  • Caltech 101: 이미지 λΆ„λ₯˜ μž‘μ—…μ„ μœ„ν•œ 101개의 객체 μΉ΄ν…Œκ³ λ¦¬λ₯Ό ν¬ν•¨ν•˜λŠ” λ°μ΄ν„°μ…‹μž…λ‹ˆλ‹€.
  • Caltech 256: Caltech 101의 ν™•μž₯판으둜 256개의 객체 μΉ΄ν…Œκ³ λ¦¬μ™€ 더 μ–΄λ €μš΄ 이미지λ₯Ό ν¬ν•¨ν•©λ‹ˆλ‹€.
  • CIFAR-10: 각 ν΄λž˜μŠ€λ‹Ή 6천 개의 이미지λ₯Ό ν¬ν•¨ν•˜λŠ” 10개의 클래슀둜 κ΅¬μ„±λœ 60K 32x32 컬러 이미지 λ°μ΄ν„°μ…‹μž…λ‹ˆλ‹€.
  • CIFAR-100: CIFAR-10의 ν™•μž₯판으둜 100개의 객체 μΉ΄ν…Œκ³ λ¦¬ 및 클래슀 λ‹Ή 600개 이미지λ₯Ό ν¬ν•¨ν•©λ‹ˆλ‹€.
  • Fashion-MNIST: 이미지 λΆ„λ₯˜ μž‘μ—…μ„ μœ„ν•œ 10개 νŒ¨μ…˜ μΉ΄ν…Œκ³ λ¦¬μ˜ 7만 개 κ·Έλ ˆμ΄μŠ€μΌ€μΌ 이미지λ₯Ό ν¬ν•¨ν•˜λŠ” λ°μ΄ν„°μ…‹μž…λ‹ˆλ‹€.
  • ImageNet: 객체 탐지 및 이미지 λΆ„λ₯˜λ₯Ό μœ„ν•œ 1400만 개의 이미지와 2만 개의 μΉ΄ν…Œκ³ λ¦¬λ₯Ό ν¬ν•¨ν•˜λŠ” λŒ€κ·œλͺ¨ λ°μ΄ν„°μ…‹μž…λ‹ˆλ‹€.
  • ImageNet-10: μ‹€ν—˜ 및 ν…ŒμŠ€νŠΈ 속도λ₯Ό 높이기 μœ„ν•œ ImageNet의 10개 μΉ΄ν…Œκ³ λ¦¬λ₯Ό ν¬ν•¨ν•˜λŠ” 더 μž‘μ€ ν•˜μœ„ μ§‘ν•©μž…λ‹ˆλ‹€.
  • Imagenette: ν›ˆλ ¨κ³Ό ν…ŒμŠ€νŠΈλ₯Ό 더 λΉ λ₯΄κ²Œ μ§„ν–‰ν•  수 μžˆλ„λ‘ μ‰½κ²Œ ꡬ별 κ°€λŠ₯ν•œ 클래슀 10개λ₯Ό ν¬ν•¨ν•˜λŠ” ImageNet의 더 μž‘μ€ ν•˜μœ„ μ§‘ν•©μž…λ‹ˆλ‹€.
  • Imagewoof: 이미지 λΆ„λ₯˜ μž‘μ—…μ„ μœ„ν•œ ImageNet의 더 μ–΄λ €μš΄ ν•˜μœ„ μ§‘ν•©μœΌλ‘œ, 10개의 개 ν’ˆμ’… μΉ΄ν…Œκ³ λ¦¬λ₯Ό ν¬ν•¨ν•©λ‹ˆλ‹€.
  • MNIST: μ†μœΌλ‘œ μ“΄ 숫자의 7만 개 κ·Έλ ˆμ΄μŠ€μΌ€μΌ 이미지λ₯Ό ν¬ν•¨ν•˜λŠ” 이미지 λΆ„λ₯˜ μž‘μ—…μ„ μœ„ν•œ λ°μ΄ν„°μ…‹μž…λ‹ˆλ‹€.

μ§€ν–₯ λ°”μš΄λ”© λ°•μŠ€ (OBB)

μ§€ν–₯ λ°”μš΄λ”© λ°•μŠ€(OBB)λŠ” 이미지 λ‚΄ λΉ„μŠ€λ“¬ν•œ 객체λ₯Ό νšŒμ „λœ λ°”μš΄λ”© λ°•μŠ€λ₯Ό μ‚¬μš©ν•˜μ—¬ νƒμ§€ν•˜λŠ” 컴퓨터 λΉ„μ „ λ°©λ²•μœΌλ‘œ, μ’…μ’… 항곡 및 μœ„μ„± μ˜μƒμ— μ μš©λ©λ‹ˆλ‹€.

  • DOTAv2: 170만 개 μΈμŠ€ν„΄μŠ€μ™€ 1만 1천 268개 이미지λ₯Ό ν¬ν•¨ν•˜λŠ” 인기 μžˆλŠ” OBB 항곡 이미지 λ°μ΄ν„°μ…‹μž…λ‹ˆλ‹€.

닀쀑 객체 좔적

닀쀑 객체 좔적은 λΉ„λ””μ˜€ μ‹œν€€μŠ€μ—μ„œ μ‹œκ°„μ— 걸쳐 μ—¬λŸ¬ 객체λ₯Ό νƒμ§€ν•˜κ³  μΆ”μ ν•˜λŠ” 컴퓨터 λΉ„μ „ κΈ°μˆ μž…λ‹ˆλ‹€.

  • Argoverse: λ„μ‹œ ν™˜κ²½μ—μ„œμ˜ 3D 좔적 및 λ™μž‘ 예츑 데이터와 ν’λΆ€ν•œ μ£Όμ„μœΌλ‘œ 닀쀑 객체 좔적 μž‘μ—…μ„ μœ„ν•œ λ°μ΄ν„°μ…‹μž…λ‹ˆλ‹€.
  • VisDrone: λ“œλ‘ μœΌλ‘œ μ΄¬μ˜ν•œ μ˜μƒμ—μ„œ 객체 탐지 및 닀쀑 객체 좔적 데이터λ₯Ό ν¬ν•¨ν•˜λŠ” λ°μ΄ν„°μ…‹μœΌλ‘œ 1만 κ°œκ°€ λ„˜λŠ” 이미지와 λΉ„λ””μ˜€ μ‹œν€€μŠ€λ₯Ό ν¬ν•¨ν•©λ‹ˆλ‹€.

μƒˆ 데이터셋 κΈ°μ—¬ν•˜κΈ°

μƒˆ 데이터셋을 κΈ°μ—¬ν•˜λŠ” 것은 κΈ°μ‘΄ 인프라와 잘 μ‘°ν™”λ˜λ„λ‘ 보μž₯ν•˜κΈ° μœ„ν•΄ μ—¬λŸ¬ 단계λ₯Ό ν¬ν•¨ν•©λ‹ˆλ‹€. μ•„λž˜λŠ” ν•„μš”ν•œ λ‹¨κ³„μž…λ‹ˆλ‹€:

μƒˆ 데이터셋 κΈ°μ—¬λ₯Ό μœ„ν•œ 단계

  1. 이미지 μˆ˜μ§‘: 데이터셋에 μ†ν•˜λŠ” 이미지λ₯Ό λͺ¨μλ‹ˆλ‹€. μ΄λŠ” 곡곡 λ°μ΄ν„°λ² μ΄μŠ€ λ˜λŠ” 자체 μˆ˜μ§‘ν•œ 자료 λ“± λ‹€μ–‘ν•œ μΆœμ²˜μ—μ„œ μˆ˜μ§‘ν•  수 μžˆμŠ΅λ‹ˆλ‹€.

  2. 이미지 주석 달기: μ΄λŸ¬ν•œ 이미지에 μž‘μ—…μ— 따라 λ°”μš΄λ”© λ°•μŠ€, μ„Έκ·Έλ¨ΌνŠΈ λ˜λŠ” ν‚€ν¬μΈνŠΈλ‘œ 주석을 λ‹΅λ‹ˆλ‹€.

  3. 주석 내보내기: 이 주석듀을 Ultralyticsκ°€ μ§€μ›ν•˜λŠ” YOLO *.txt 파일 ν˜•μ‹μœΌλ‘œ λ³€ν™˜ν•©λ‹ˆλ‹€.

  4. 데이터셋 ꡬ성: 데이터셋을 μ˜¬λ°”λ₯Έ 폴더 ꡬ쑰둜 λ°°μ—΄ν•©λ‹ˆλ‹€. 'train/'κ³Ό 'val/' μƒμœ„ 디렉토리λ₯Ό κ°–κ³  μžˆμ–΄μ•Ό ν•˜λ©°, 각각 'images/' 및 'labels/' ν•˜μœ„ 디렉토리가 μžˆμ–΄μ•Ό ν•©λ‹ˆλ‹€.

    dataset/
    β”œβ”€β”€ train/
    β”‚   β”œβ”€β”€ images/
    β”‚   └── labels/
    └── val/
        β”œβ”€β”€ images/
        └── labels/
    
  5. data.yaml 파일 생성: λ°μ΄ν„°μ…‹μ˜ 루트 λ””λ ‰ν† λ¦¬μ—μ„œ 데이터셋, 클래슀 및 기타 ν•„μš”ν•œ 정보λ₯Ό μ„€λͺ…ν•˜λŠ” data.yaml νŒŒμΌμ„ λ§Œλ“­λ‹ˆλ‹€.

  6. 이미지 μ΅œμ ν™” (선택): 처리 과정을 더 효율적으둜 ν•˜κΈ° μœ„ν•΄ λ°μ΄ν„°μ…‹μ˜ 크기λ₯Ό μ€„μ΄κ³ μž ν•œλ‹€λ©΄ μ•„λž˜μ˜ μ½”λ“œλ₯Ό μ‚¬μš©ν•˜μ—¬ 이미지λ₯Ό μ΅œμ ν™”ν•  수 μžˆμŠ΅λ‹ˆλ‹€. ν•„μˆ˜λŠ” μ•„λ‹ˆμ§€λ§Œ, 데이터셋 크기λ₯Ό μž‘κ²Œν•˜κ³  λ‹€μš΄λ‘œλ“œ 속도λ₯Ό λΉ λ₯΄κ²Œ ν•˜λŠ” 것이 μΆ”μ²œλ©λ‹ˆλ‹€.

  7. 데이터셋 μ••μΆ•: 전체 데이터셋 폴더λ₯Ό zip 파일둜 μ••μΆ•ν•©λ‹ˆλ‹€.

  8. λ¬Έμ„œν™” 및 PR: 데이터셋에 λŒ€ν•œ μ„€λͺ…κ³Ό κΈ°μ‘΄ ν”„λ ˆμž„μ›Œν¬μ™€μ˜ 적합성에 λŒ€ν•΄ μ„€λͺ…ν•˜λŠ” λ¬Έμ„œν™” νŽ˜μ΄μ§€λ₯Ό λ§Œλ“  λ‹€μŒ, ν’€ λ¦¬ν€˜μŠ€νŠΈ(PR)λ₯Ό μ œμΆœν•©λ‹ˆλ‹€. PR을 μ œμΆœν•˜λŠ” 더 μžμ„Έν•œ 방법에 κ΄€ν•΄μ„œλŠ” Ultralytics κΈ°μ—¬ κ°€μ΄λ“œλΌμΈμ„ μ°Έκ³ ν•˜μ‹­μ‹œμ˜€.

데이터셋 μ΅œμ ν™” 및 μ••μΆ• 예제 μ½”λ“œ

!!! Example "데이터셋 μ΅œμ ν™” 및 μ••μΆ•"

=== "Python"

```python
from pathlib import Path
from ultralytics.data.utils import compress_one_image
from ultralytics.utils.downloads import zip_directory

# 데이터셋 디렉토리 μ •μ˜
path = Path('path/to/dataset')

# λ°μ΄ν„°μ…‹μ˜ 이미지 μ΅œμ ν™” (선택사항)
for f in path.rglob('*.jpg'):
    compress_one_image(f)

# 'path/to/dataset.zip'으둜 데이터셋 μ••μΆ•
zip_directory(path)
```

이 단계듀을 λ”°λ₯΄λ©΄ Ultralytics의 κΈ°μ‘΄ ꡬ쑰와 잘 ν†΅ν•©λ˜λŠ” μƒˆλ‘œμš΄ 데이터셋을 κΈ°μ—¬ν•  수 μžˆμŠ΅λ‹ˆλ‹€.

Tip!

Press p or to see the previous file or, n or to see the next file

Comments

Loading...