<aside> 🔄 크롤링 자동화 파이프라인 구축

크롤링.png

(특정 키워드)+(카테고리) 이미지 수집 태스크 (ex. 여름 바지)

  1. 크롤링

    구글(Selenium), 11번가(api), 네이버(api) 이미지

  2. 중복 이미지 제거

    라이브러리 활용 https://github.com/elisemercury/Duplicate-Image-Finder

  3. 남성 제품 제외: 플랫폼은 여성 제품을 위주로 하기에 남성 제품 제외

    (1) 성별 분류 이미지 모델

    남녀 얼굴 크롤링, 얼굴 crop 라이브러리 활용, resnet50 모델링

    (2) “남자”, “남성” 키워드를 가지고 있으나 “여성”, “여자”라는 키워드는 없는 경우 제외

    (3) 성별 분류 이미지 모델을 활용하여 남자 얼굴은 있으나 여자 얼굴은 없는 경우 제외

  4. 카테고리 분류

    yolov8 모델링 및 적용

<aside> 📊 대시보드 제작

리대시 Redash 및 SQL 쿼리를 활용하여, 모델 커버리지 관련 대시보드 제작

대시보드1 copy.jpg

대시보드2 copy.jpg

</aside>

리대시 소개글