🖥️ IT, 컴퓨터/🐍 Python

[Python] 피벗테이블 함수 사용 :: .pivot_table(index = , values = , aggfunc = )

김 홍시 2024. 1. 23.
반응형

* 제품군(Product_Type) 별로 월렌탈비용(Amount_Month) 평균 계산

df1.pivot_table(index = "Product_Type", values = "Amount_Month", aggfunc = 'mean'  )​

index = 구분하고자 하는 값. df의 index로 잡힘, values = 계산하고자 하는 값, aggfunc = 계산하고자 하는 통계량

 

 

* 제품군(Product_Type) 별, 계약 유형(Contract_Type)별 월렌탈비용(Amount_Month) 평균 계산 

p1 = df1.pivot_table(index = ["Product_Type", "Contract_Type"], values = 'Amount_Month')
p1   #index로 빠져버림.

 

 

 

 

* 제품군(Product_Type) 별, 계약 유형(Contract_Type)별 월렌탈비용(Amount_Month) 평균 계산 

- index로 빠지지 않고 데이터로 남아 활용할 수 있게 됨 

p1 = df1.pivot_table(index = ["Product_Type", "Contract_Type"], values = 'Amount_Month'). reset_index()
p1   
p1.sort_values(by = "Amount_Month", ascending  = False)

 

 

 

* 결제은행 (Bank) 별 제품군(Product_Type)에 따른 월 렌탈 비용의 합
- index가 너무 길어짐.

df1.pivot_table(index = ["Product_Type", "Bank"], values = "Amount_Month", aggfunc = "sum")

 

 

 

* 결제은행 (Bank) 별 제품군(Product_Type)에 따른 월 렌탈 비용의 합
- 층별화 시 범주형 항목이 많을 때, 직관적으로 데이터를 보기 위해 column  = 사용하기도 함 

 

df1.pivot_table(index = "Product_Type", columns = "Bank", values = "Amount_Month", aggfunc = "sum")

 

 

* 결제은행 (Bank) 별 제품군(Product_Type)에 따른 월 렌탈 비용의 합
- NaN 결측값을 0으로 바꿔줌

 

df1.pivot_table(index = "Product_Type", columns = "Bank", values = "Amount_Month", aggfunc = "sum", fill_value = 0)

 

 

 

 

index에는 제품명, column에는 연도, values에는 판매액을 배치한 사례. 

반응형

댓글