PYTHON/Pandas 판다스

[PYTHON] 데이터프레임 전처리 (병합, 결합)

G허니 2024. 3. 10. 23:14

데이터 분석 및 전처리 작업에서 여러 데이터프레임을 효과적으로 합치는 것은 중요한 단계 중 하나입니다. 여기에서는 concat()merge() 함수를 사용하여 데이터프레임을 합치는 방법에 대해 알아보겠습니다.

concat() 함수로 데이터프레임 합치기

concat() 함수를 사용하면 데이터프레임을 열 또는 행을 기준으로 합칠 수 있습니다.

# axis=1: 열이 늘어남 / axis=0: 행이 늘어남
pop = pd.concat([pop01, pop02], axis=1, join='outer')  # inner로 변경 가능

 

merge() 함수로 데이터프레임 합치기

merge() 함수를 사용하면 특정 열을 기준으로 데이터프레임을 합칠 수 있습니다.

# on: 합칠 열
# how: join 종류 (left, right, inner, outer)
pop = pd.merge(pop01, pop02, on='year', how='inner')

위 코드는 pop01pop02 데이터프레임을 'year' 열을 기준으로 합칩니다. how 매개변수를 사용하여 left, right, inner, outer 중 선택할 수 있습니다. 여기서는 inner 방식을 사용했습니다.