본문 바로가기

df2

[PYTHON] 데이터프레임 집계 데이터를 상세히 살펴보지 않고도 집계된 데이터를 통해 통계적인 통찰을 얻는 것은 데이터 분석에서 중요한 부분입니다. 판다스에서는 sum(), mean(), max(), min(), count() 등의 메서드를 사용하여 데이터프레임을 간편하게 집계할 수 있습니다. 이때, 데이터를 분석하고 이해하는 과정에서 연속값과 범주값은 중요한 역할을 합니다. 연속값은 숫자로 표현되며 연속된 범위를 가지는 데이터를 나타냅니다. 반면 범주값은 일정한 카테고리 또는 그룹으로 나뉘어지는 값들을 의미합니다. 집계 하기 # total_bill 열의 합계 계산 total_bill_sum = df['total_bill'].sum() print("Total Bill Sum:", total_bill_sum) 'total_bill' 열의.. 2024. 3. 10.
[PYTHON] 데이터프레임 생성 데이터프레임은 Pandas 라이브러리의 핵심 구성 요소 중 하나로, 엑셀의 스프레드시트와 비슷한 테이블 형태의 데이터 구조입니다. 이는 데이터 처리, 조회, 분석에 있어 굉장히 효율적인 방법입니다. 자동차 연비 데이터셋 같은 경우, 리스트나 딕셔너리, 배열 형태로는 저장하기 어렵지만, 데이터프레임 형태로는 쉽게 저장하고 처리(변경, 분석 등)할 수 있습니다. 데이터프레임의 형태 데이터프레임은 행과 열로 이루어져 있으며, 각각의 행은 인덱스로, 열은 열 이름으로 구분됩니다. 인덱스와 열 이름이 없는 형태: 인덱스와 열 이름이 없는 데이터프레임은 실무에서는 자주 보기 어렵습니다. 열 이름을 지정한 형태: 열 이름만 지정한 데이터프레임 형태는 자주 보게 됩니다. 특별히 인덱스를 지정할 필요가 없는 경우가 많습.. 2024. 3. 1.