본문 바로가기

PYTHON/Pandas 판다스11

[Python] matplotlib 한글 깨짐 문제 해결 매트플롯립(Matplotlib)은 파이썬에서 데이터 시각화를 위해 널리 사용되는 라이브러리입니다. 그러나 한글을 사용하는 경우에는 매트플롯립에서 한글이 깨지는 문제가 종종 발생합니다. 이러한 문제는 주로 매트플롯립이 기본적으로 지원하는 폰트가 한글을 지원하지 않기 때문에 발생합니다. 따라서 한글을 제대로 출력하려면 추가적인 설정이 필요합니다. 이번 글에서는 매트플롯립에서 한글이 깨지는 문제를 해결하는 방법에 대해 알아보겠습니다. !sudo apt-get install -y fonts-nanum !sudo fc-cache -fv !rm ~/.cache/matplotlib -rf 해당 코드를 실행 후 런타임 -> 세션 다시 클릭을 합니다. 그 후, 라이브러리를 import하면 그래프에 한글이 정상적으로 출력.. 2024. 3. 20.
[PYTHON] One-Hot Encoding - 가변수(Dummy Variable) 만들기 가변수 또는 더미 변수는 범주형 데이터를 수치형으로 변환하는 데 사용되는 중요한 개념 중 하나입니다. 이를 통해 기계 학습 모델이 범주형 데이터를 이해하고 처리할 수 있게 됩니다. One-Hot-Encoding은 가변수를 만드는 흔한 방법 중 하나입니다. One-Hot-Encoding이란? One-Hot-Encoding은 범주형 변수를 0 또는 1의 이진 값으로 변환하는 프로세스입니다. 이는 해당하는 범주에 속하면 1로, 그렇지 않으면 0으로 표시됩니다. 예를 들어, '색깔'이라는 범주형 변수가 있다면, '빨강' 또는 '노랑', '초록'인 경우 해당 변수를 3 개의 변수로 분리하여 표현합니다. One-Hot-Encoding의 필요성 기계 학습 모델은 수치형 데이터를 더 잘 처리할 수 있습니다. 그러나 많.. 2024. 3. 10.
[PYTHON] 데이터프레임 전처리 (병합, 결합) 데이터 분석 및 전처리 작업에서 여러 데이터프레임을 효과적으로 합치는 것은 중요한 단계 중 하나입니다. 여기에서는 concat()과 merge() 함수를 사용하여 데이터프레임을 합치는 방법에 대해 알아보겠습니다. concat() 함수로 데이터프레임 합치기 concat() 함수를 사용하면 데이터프레임을 열 또는 행을 기준으로 합칠 수 있습니다. # axis=1: 열이 늘어남 / axis=0: 행이 늘어남 pop = pd.concat([pop01, pop02], axis=1, join='outer') # inner로 변경 가능 merge() 함수로 데이터프레임 합치기 merge() 함수를 사용하면 특정 열을 기준으로 데이터프레임을 합칠 수 있습니다. # on: 합칠 열 # how: join 종류 (left,.. 2024. 3. 10.
[PYTHON] 데이터프레임 전처리 (결측치) 결측치(NaN)는 데이터 분석 및 머신러닝 모델 학습 과정에서 예기치 못한 문제를 초래할 수 있습니다. 결측치를 무시하거나 그대로 둘 경우, 통계 분석이나 머신러닝 알고리즘에서 예상치 못한 동작이 발생할 수 있습니다. 따라서 결측치 처리는 데이터 전처리의 중요한 단계 중 하나입니다. info() 메서드 활용 info() 메서드는 데이터프레임의 각 열에 대한 요약 정보를 제공하며, 결측치의 존재 여부를 파악할 수 있습니다. # info() 메서드로 결측치 확인 df.info() isna() 또는 isnull() 메서드 활용 # isna() 또는 isnull() 메서드로 결측치 확인 df.isna() isna() 또는 isnull() 메서드는 각 데이터프레임 요소에 대해 결측치 여부를 확인하는 불리언(Boo.. 2024. 3. 10.