PYTHON/데이터 분석

[PYTHON] 데이터 분석

G허니 2024. 3. 25. 22:58

데이터 분석은 비즈니스 문제 해결을 위해 데이터를 수집하고 분석하는 과정입니다. CRISP-DM 프로세스는 데이터 분석 프로젝트를 체계적으로 진행하기 위한 표준 프로세스로, 비즈니스 이해부터 데이터 이해, 데이터 준비, 모델링, 평가, 배포 단계까지 포함합니다.

 

CRISP-DM 프로세스

 

CRISP-DM 프로세스
  • 비즈니스 이해: 프로젝트 목표와 요구사항을 정의합니다.
  • 데이터 이해: 분석에 필요한 데이터를 수집하고 이해합니다.
  • 데이터 준비: 데이터를 분석하기 적합한 형태로 가공합니다.
  • 모델링: 데이터를 기반으로 모델을 생성합니다.
  • 평가: 모델의 성능을 평가합니다.
  • 배포: 모델을 실제 환경에 적용합니다

 

 

분석을 할수 있는 데이터의 종류

데이터에 따라 분석을 하는 방법이 달라진다.

 

수치형 데이터의 경우 기초통계랑과 도수분포표로 분석을 진행하며

기초통계랑은 평균, 중앙값, 최빈값, 사분위수등의 방법이 있고

도수분포표의 경우 구간을 나누고 빈도수를 계산한다. (Histogram, KDE plot)

 

범주형 데이터의 경우 수치형의 도수분포표와 같이 빈도수를 계산한다.