파이썬-데이터프레임 변환 melt, pivot 함수 사용하기
보통 원본 데이터는 사람이 보기 좋게 "가로로 넓게(wide)" 되어 있는데, 분석 라이브러리(pandas groupby, seaborn, matplotlib, pivot_table) 등은 "세로(long)" 구조일 때 더 다루기 편리합니다. 다음의 예시의 경우 melt() 함수를 이용하여 쉽게 분석작업이 가능합니다. 1. melt() 사용이 유리한 상황 예시1️⃣ 월별 데이터를 시각화할 때df = pd.DataFrame({ "지역": ["서울", "부산", "대구"], "1월": [100, 150, 120], "2월": [200, 250, 300], "3월": [130, 180, 160]})현재 구조: wide문제점: matplotlib이나 seaborn으로 월을 x축에, 매출을..
2025. 8. 17.
파이썬-피봇테이블(pivot table) NaN, 다중컬럼 처리하기
데이터프레임을 활용한 통계작업으로 pivot_table 과 groupby 를 많이 사용합니다.그런데 다양한 통계데이터 처리를 하기 위해 몇가지 팁을 알면 좀 더 효율적인 작업이 가능합니다. 이번에는 기본적인 피봇테이블 사용과 데이터가 결측치로 없을 때 처리방법, 그리고 여러 컬럼의 데이터를 통계로 한번에 표출하는 방법에 대해 정리하였습니다. 1. 기본 Pivot Table 만들기일반적인 데이터프레임에서 values, index, columns, aggfunc 값을 지정 👉 aggfuncsum (합계), count (개수), mean (평균), median (중앙값), min (최소값), max (최대값), std (표준편차) 인덱스 2개, 컬럼 1개에 대한 sum 사용import pandas as p..
2025. 8. 17.