데이터분석5 [KT AIVLE SCHOOL] KT Aivle 3차 미니프로젝트 후기 1 KT AIVLE SCHOOL 3차 미니프로젝트는 총 4일 동안 2개의 주제로 진행되었습니다. 두 프로젝트 모두 머신러닝을 활용하여 진행되었습니다. 1. 스마트폰 센서 데이터 기반 행동 인식 분류 이 프로젝트는 스마트폰의 다양한 센서 데이터를 활용하여 사람의 행동을 인식하고 분류하는 것이 목표였습니다.인간 행동 인식(HAR) 기술은 다양한 센서를 통해 사람의 모션 정보를 수집하고 해석하여 행동을 인식하는 기술입니다.지도학습 방식으로 진행되었으며, 다양한 알고리즘(Random Forest, Logistic Regression, SVM, KNN 등)을 활용하여 분류 모델을 생성하고 성능을 검증하였습니다. 하이퍼파라메터를 조정하고 행동을 분류하였을때 로지스틱 회귀가 가장 좋은 성능을 보여 저희는 로지스틱 회계.. 2024. 4. 16. [PYTHON] 이변량 분석 데이터 분석의 핵심 단계 중 하나는 이변량 분석입니다. 이변량 분석을 통해 두 변수 간의 관계를 파악하고, 이를 바탕으로 데이터에서 숨겨진 인사이트를 발견할 수 있습니다. 이변량 분석은 크게 네 가지 유형으로 나눌 수 있으며, 각각의 유형에 따라 다양한 시각화 기법과 수치화 방법이 사용됩니다. 숫자 -> 숫자 시각화: 산점도(scatter plot)는 두 수치형 변수 간의 관계를 시각적으로 표현하는 데 사용됩니다. 이를 통해 변수들 사이의 상관성을 직관적으로 파악할 수 있습니다. 수치화: 상관분석은 두 변수 간의 선형적 상관 관계를 수치로 표현합니다. 상관계수는 -1에서 1 사이의 값을 가지며, 이는 변수 간의 관계의 방향과 강도를 나타냅니다. 한계: 상관분석은 선형 관계만을 고려합니다. 따라서 변수 간.. 2024. 3. 25. [PYTHON] 데이터 분석 데이터 분석은 비즈니스 문제 해결을 위해 데이터를 수집하고 분석하는 과정입니다. CRISP-DM 프로세스는 데이터 분석 프로젝트를 체계적으로 진행하기 위한 표준 프로세스로, 비즈니스 이해부터 데이터 이해, 데이터 준비, 모델링, 평가, 배포 단계까지 포함합니다. CRISP-DM 프로세스 비즈니스 이해: 프로젝트 목표와 요구사항을 정의합니다. 데이터 이해: 분석에 필요한 데이터를 수집하고 이해합니다. 데이터 준비: 데이터를 분석하기 적합한 형태로 가공합니다. 모델링: 데이터를 기반으로 모델을 생성합니다. 평가: 모델의 성능을 평가합니다. 배포: 모델을 실제 환경에 적용합니다 분석을 할수 있는 데이터의 종류 데이터에 따라 분석을 하는 방법이 달라진다. 수치형 데이터의 경우 기초통계랑과 도수분포표로 분석을 진.. 2024. 3. 25. [Python] matplotlib 한글 깨짐 문제 해결 매트플롯립(Matplotlib)은 파이썬에서 데이터 시각화를 위해 널리 사용되는 라이브러리입니다. 그러나 한글을 사용하는 경우에는 매트플롯립에서 한글이 깨지는 문제가 종종 발생합니다. 이러한 문제는 주로 매트플롯립이 기본적으로 지원하는 폰트가 한글을 지원하지 않기 때문에 발생합니다. 따라서 한글을 제대로 출력하려면 추가적인 설정이 필요합니다. 이번 글에서는 매트플롯립에서 한글이 깨지는 문제를 해결하는 방법에 대해 알아보겠습니다. !sudo apt-get install -y fonts-nanum !sudo fc-cache -fv !rm ~/.cache/matplotlib -rf 해당 코드를 실행 후 런타임 -> 세션 다시 클릭을 합니다. 그 후, 라이브러리를 import하면 그래프에 한글이 정상적으로 출력.. 2024. 3. 20. 이전 1 2 다음