본문 바로가기

데이터처리3

[PYTHON] 데이터프레임 탐색 데이터프레임 탐색은 데이터의 특성과 구조를 파악하는 과정입니다. 이를 통해 데이터의 크기, 내용, 분포 등을 확인하고, 데이터처리의 필요성을 판단합니다. 이번 섹션에서는 Seab 라이브러리에서 제공하는 tips 데이터셋을 이용하여 데이터프레임을 탐색하는 방법에 대해 알아보겠습니다. # 라이브러리 불러오기 seaborn as sns import pandas as pd import numpy as np # 데이터 불러오기 tips = sns.load_dataset("tips") 데이터 일부 확인 및 크기 확인 데이터를 처음 불러왔을 때, head() 함수나 tail() 함수를 이용해 상위 혹은 하위 일부 데이터를 확인합니다. # 상위 5개 데이터 확인 display(tips.head()) # 하위 5개 데이.. 2024. 3. 1.
[PYTHON] 엑셀 파일 다루기 (openpyxl 라이브러리 활용) 파이썬을 이용해 엑셀 파일을 다루는 방법을 알아보겠습니다. openpyxl 라이브러리를 활용하면 엑셀과 파이썬을 연동하여 업무 자동화를 구현할 수 있습니다. 엑셀 파일 열기 먼저 openpyxl 라이브러리를 불러옵니다. # 라이브러리 불러오기 import openpyxl as xl load_workbook() 함수를 사용해 엑셀 파일을 불러옵니다. # 워크북 객체 선언(엑셀 파일 열기) wb = xl.load_workbook('Sales.xlsx') 파일에 포함된 모든 시트 이름을 확인하려면 sheetnames 속성을 사용합니다. # 시트 이름 확인 print(wb.sheetnames) 엑셀 파일 읽기 파일을 열었으므로, 작업 대상 시트를 선택합니다. # 시트 선택 sheet1 = wb['Sheet1'].. 2024. 3. 1.
[PYTHON] 정규 표현식 정규 표현식은 Python만의 기능이 아닌, 문자열을 다루는 여러 곳에서 사용되는 공통된 표현식입니다. 처음에는 이해하기 어려울 수 있지만, 한번 익혀두면 매우 유용한 기능입니다. 정규식 사용 전/후 비교 정규 표현식을 사용하면 복잡한 반복문 없이도 간결한 코드를 작성할 수 있습니다. 예를 들어, 문자열에서 이름과 전화번호가 섞여 있는 경우, 전화번호 뒤 네 자리를 XXXX로 변경하는 상황을 생각해봅시다. 1) 반복문으로 처리 반복문을 사용하여 전화번호 뒷자리를 XXXX로 변경하는 코드는 다음과 같습니다. # 이름과 전화번호가 섞여 있는 문자열 peoples = '김철수: 010-1234-5678 박영희: 010-4321-8765 이민지: 010-2143-6587' # 전화번호 뒷자리 숨기기 phone_.. 2024. 3. 1.