Python 7

[Python] 이미지 데이터셋 수집 방법 3가지

1. roboflow https://public.roboflow.com/ 2. kaggle https://www.kaggle.com/datasets 3. 구글 이미지 크롤링 import ssl import os import sys import time import urllib.request from selenium import webdriver from selenium.webdriver.common.keys import Keys from selenium.webdriver.common.by import By ssl._create_default_https_context = ssl._create_unverified_context searchKey = input('Search Keyword : ') # 저장할 ..

[Python] labelImg를 활용한 이미지 라벨링

1. labelImg란 - labelImg는 이미지 주석 도구로, 개발자들이 객체 감지 모델을 학습하기 위해 이미지에 주석을 달 수 있도록 도와준느 프로그램이다. 이 프로그램은 영상 및 이미지 처리 작업에 많이 사용되며, 객체 감지 모델을 구축하는 데 필수적인 작업 중 하나이다. 2. labelImg 설치 https://github.com/tzutalin/labelImg - 먼저 github에 들어가 Releases -> Binary v1.8.1을 클릭한다. - windows_v 1.8.1.zip 파일을 다운로드 받는다. - zip 파일을 풀면 data, labelImg 두 파일이 생성된다. - data 안에는 txt 파일이 들어있는데 이 곳은 라벨링할 클래스명을 적어주면된다. (ex. monkey) -..

[Python] YOLOv7을 활용한 이미지 분석

1. YOLOv7이란 - YOLOv7은 객체 탐지 알고리즘 중 하나인 You Only Look Once (YOLO)의 버전 7이다. - 실시간으로 탐지가 가능하고 속도가 빠르다. - 다중 객체 탐지가 가능하다. 한 이미지에서 여러 객체를 동시에 탐지할 수 있다. - 객체의 크기와 종횡비에 강인해 작은 객체나 다양한 크기의 객체도 정확히 탐지가 가능하다. 2. YOLOv7 설치 https://github.com/WongKinYiu/yolov7 - 먼저 github에 들어가 zip파일을 다운로드 받는다. 3. Jupyter Notebook import os os.getcwd() 실행 결과 : '/storage01/shared_data/users/youngseok/YOLOv7' - 주피터 노트북에 다운로드 받..

[Python] 캐글(kaggle) 필사 전략

// 퇴근후딴짓 님의 강의를 참고하였습니다. // 1. 캐글 회원가입 및 로그인하기 https://www.kaggle.com/ 2. Competitions(경연 대회) 클릭 3. 입문자가 가장 많이 해보는 Titanic Dataset 클릭 4. Code 클릭 5. Titanic Tutorial 클릭 → 우측에 보이는 숫자가 UP 버튼으로 가장 높은 숫자의 코드를 봐도 되나 입문자가 따라하기에는 어렵다. → 이때 검색창에 tutorial / starter / simple 단어로 검색하면 입문자용 코드를 찾을 수 있다. 6. 코드 필사하기 → 인터넷 창을 한 개 더 띄워 똑같이 Titanic Dataset 클릭하여 들어온 후 New Notebook 버튼을 클릭한다. → Notebook 버튼 클릭하면 note..

Python 2023.06.20

[Python] 온라인 쇼핑 해외 판매액 데이터를 활용한 온라인 시장 동향 파악

1. 서론 1) 프로젝트 개요 분석에 사용할 데이터는 2017~2022년도 온라인 쇼핑 해외 판매 데이터로 지역별, 상품군별, 판매유형별로 분류 되어있다. 이 데이터는 연도(분기)별로 기록되어 있으며 판매액의 단위는 백만원이다. 해당 데이터를 시계열 분석하여 전체 품목의 총 판매액 추이, 특정 지역의 특정 상품군 판매액 추이, 그리고 지역별 전체 판매액 비교 등 다양한 시각화 분석을 통해 온라인 시장 동향을 파악하고자 한다. 2) 가설 설정 1. 최대 판매 지역은 중국일 것이다. 2. 최대 판매 상품은 전자(반도체)일 것이다. 3. 코로나가 시작된 2020년도부터 판매액은 감소할 것이다. 3) 사용한 데이터 통계청 데이터 컬럼명 컬럼 의미 지역별 국..

Python 2023.05.22

[Python] 딥러닝 분석

보고서 : [인공신경망] 문제 1) 제품적절성이 제품만족도에 미치는 영향 주제로 딥러닝 교재 3장에서 사용된 인공신경망을 이용한 선형 회귀분석을 python으로 실행하시오. [로지스틱 회귀 분석] 문제 2) 비 유무 예측 주제로 딥러닝 교재 4장에서 사용된 인공신경망을 이용한 로지스틱 회귀분석을 python으로 실행하시오. [텐서플로와 케라스를 이용한 인공신경망] 3. 다중분류를 위해 딥러닝 교재 7장에서 사용된 텐서플로와 케라스을 이용한 인공신경망을 python으로 실행하여 모델 성능평가를 실시하시오. [합성곱 신경망(CNN; Convolution Neural Network)] 문제 4) 개와 고양이의 이미지 분류 문제에서 다음의 데이터대상으로 Convolution Neural Network 을 이용하..

Python 2023.05.03

[Python] 코로나 데이터 분석

보고서 : 아래 site에서 제공된 데이터셋은 Johns’ Hopkis 대학 내 The Center For Systems Science and Engineering(CSSE) 에서 업데이트 하는 전세계 코로나 (COVID-19) 발생 현황 데이터셋이다. 제공된 데이터셋 중 2021년 8월~2022년 7월 일간 데이터를 대상으로 numpy & pandas package 내 함수로 다음을 수행하고 결과 및 insight를 팀 별로 리포트 하시오. (누적데이터인 경우 누적데이터로 해당 결과를 제시하고, 일별 데이터 를 산출하여 총합과 일평균값을 산출하여 결과 비교) COVID-19/csse_covid_19_data/csse_covid_19_daily_reports at 770dafdb73e9dc31140db7..

Python 2023.05.03