본문 바로가기

PYTHON/데이터 분석2

[PYTHON] 이변량 분석 데이터 분석의 핵심 단계 중 하나는 이변량 분석입니다. 이변량 분석을 통해 두 변수 간의 관계를 파악하고, 이를 바탕으로 데이터에서 숨겨진 인사이트를 발견할 수 있습니다. 이변량 분석은 크게 네 가지 유형으로 나눌 수 있으며, 각각의 유형에 따라 다양한 시각화 기법과 수치화 방법이 사용됩니다. 숫자 -> 숫자 시각화: 산점도(scatter plot)는 두 수치형 변수 간의 관계를 시각적으로 표현하는 데 사용됩니다. 이를 통해 변수들 사이의 상관성을 직관적으로 파악할 수 있습니다. 수치화: 상관분석은 두 변수 간의 선형적 상관 관계를 수치로 표현합니다. 상관계수는 -1에서 1 사이의 값을 가지며, 이는 변수 간의 관계의 방향과 강도를 나타냅니다. 한계: 상관분석은 선형 관계만을 고려합니다. 따라서 변수 간.. 2024. 3. 25.
[PYTHON] 데이터 분석 데이터 분석은 비즈니스 문제 해결을 위해 데이터를 수집하고 분석하는 과정입니다. CRISP-DM 프로세스는 데이터 분석 프로젝트를 체계적으로 진행하기 위한 표준 프로세스로, 비즈니스 이해부터 데이터 이해, 데이터 준비, 모델링, 평가, 배포 단계까지 포함합니다. CRISP-DM 프로세스 비즈니스 이해: 프로젝트 목표와 요구사항을 정의합니다. 데이터 이해: 분석에 필요한 데이터를 수집하고 이해합니다. 데이터 준비: 데이터를 분석하기 적합한 형태로 가공합니다. 모델링: 데이터를 기반으로 모델을 생성합니다. 평가: 모델의 성능을 평가합니다. 배포: 모델을 실제 환경에 적용합니다 분석을 할수 있는 데이터의 종류 데이터에 따라 분석을 하는 방법이 달라진다. 수치형 데이터의 경우 기초통계랑과 도수분포표로 분석을 진.. 2024. 3. 25.