본문 바로가기

전처리2

[PYTHON] 데이터프레임 전처리 (결측치) 결측치(NaN)는 데이터 분석 및 머신러닝 모델 학습 과정에서 예기치 못한 문제를 초래할 수 있습니다. 결측치를 무시하거나 그대로 둘 경우, 통계 분석이나 머신러닝 알고리즘에서 예상치 못한 동작이 발생할 수 있습니다. 따라서 결측치 처리는 데이터 전처리의 중요한 단계 중 하나입니다. info() 메서드 활용 info() 메서드는 데이터프레임의 각 열에 대한 요약 정보를 제공하며, 결측치의 존재 여부를 파악할 수 있습니다. # info() 메서드로 결측치 확인 df.info() isna() 또는 isnull() 메서드 활용 # isna() 또는 isnull() 메서드로 결측치 확인 df.isna() isna() 또는 isnull() 메서드는 각 데이터프레임 요소에 대해 결측치 여부를 확인하는 불리언(Boo.. 2024. 3. 10.
[PYTHON] 데이터프레임 전처리 (열 이름 변경, 추가, 삭제) 데이터프레임의 열을 관리하는 것은 데이터 전처리 및 분석 작업에서 중요한 부분입니다. 아래는 열 이름을 변경하고, 새로운 열을 추가하며, 열을 삭제하는 것입니다. 모든 열 이름 변경 # 모든 열 이름 변경 df.columns = ['total_bill', 'tip', 'sex', 'smoker', 'day', 'time', 'size'] 데이터프레임의 모든 열 이름을 새로운 리스트로 변경합니다. 일부 열 이름 변경 # rename() 함수로 열 이름 변경 df.rename(columns= {'total_bill_amount' : 'total_bill'}, inplace=True) 데이터프레임의 일부 열 이름을 새로운 리스트로 변경합니다. 열 추가 # 열 추가 df['zero'] = 0 'zero'라는 새.. 2024. 3. 10.