PYTHON/Pandas 판다스11 [PYTHON] 데이터프레임 탐색 데이터프레임 탐색은 데이터의 특성과 구조를 파악하는 과정입니다. 이를 통해 데이터의 크기, 내용, 분포 등을 확인하고, 데이터처리의 필요성을 판단합니다. 이번 섹션에서는 Seab 라이브러리에서 제공하는 tips 데이터셋을 이용하여 데이터프레임을 탐색하는 방법에 대해 알아보겠습니다. # 라이브러리 불러오기 seaborn as sns import pandas as pd import numpy as np # 데이터 불러오기 tips = sns.load_dataset("tips") 데이터 일부 확인 및 크기 확인 데이터를 처음 불러왔을 때, head() 함수나 tail() 함수를 이용해 상위 혹은 하위 일부 데이터를 확인합니다. # 상위 5개 데이터 확인 display(tips.head()) # 하위 5개 데이.. 2024. 3. 1. [PYTHON] 데이터프레임 생성 데이터프레임은 Pandas 라이브러리의 핵심 구성 요소 중 하나로, 엑셀의 스프레드시트와 비슷한 테이블 형태의 데이터 구조입니다. 이는 데이터 처리, 조회, 분석에 있어 굉장히 효율적인 방법입니다. 자동차 연비 데이터셋 같은 경우, 리스트나 딕셔너리, 배열 형태로는 저장하기 어렵지만, 데이터프레임 형태로는 쉽게 저장하고 처리(변경, 분석 등)할 수 있습니다. 데이터프레임의 형태 데이터프레임은 행과 열로 이루어져 있으며, 각각의 행은 인덱스로, 열은 열 이름으로 구분됩니다. 인덱스와 열 이름이 없는 형태: 인덱스와 열 이름이 없는 데이터프레임은 실무에서는 자주 보기 어렵습니다. 열 이름을 지정한 형태: 열 이름만 지정한 데이터프레임 형태는 자주 보게 됩니다. 특별히 인덱스를 지정할 필요가 없는 경우가 많습.. 2024. 3. 1. [PYTHON] NUMPY 넘파이 Numpy는 파이썬에서 벡터, 행렬 등 수치 연산을 효율적으로 처리할 수 있게 도와주는 라이브러리입니다. Numpy 배열은 1차원, 2차원, 3차원등 다차원 배열을 생성할 수 있고, Reshape 기능을 활용하여 배열의 형태를 자유롭게 변경할수 있습니다. 물론, 데이터를 조회하는 기법인 인덱싱과 슬라이싱을 통해 원하는 데이터를 효과적으로 뽑아낼수 있습니다. 라이브러리 불러오기 Numpy 배열을 사용하려면 먼저 numpy 라이브러리를 불러와야 합니다. numpy 라이브러리는 일반적으로 np라는 별칭을 붙여 불러옵니다. import numpy as np 용어 정의 [용어] axis: 배열의 각 축 rank: 축의 개수 shape: 축의 길이, 배열의 크기 [3 x 4 배열의 경우] axis 0 과 axis .. 2024. 3. 1. 이전 1 2 3 다음