-
[Python] 피벗테이블 함수 사용 :: .pivot_table(index = , values = , aggfunc = )
* 제품군(Product_Type) 별로 월렌탈비용(Amount_Month) 평균 계산 df1.pivot_table(index = "Product_Type", values = "Amount_Month", aggfunc = 'mean' ) index = 구분하고자 하는 값. df의 index로 잡힘, values = 계산하고자 하는 값, aggfunc = 계산하고자 하는 통계량 * 제품군(Product_Type) 별, 계약 유형(Contract_Type)별 월렌탈비용(Amount_Month) 평균 계산 p1 = df1.pivot_table(index = ["Product_Type", "Contract_Type"], values = 'Amount_Month') p1 #index로 빠져버림. * 제품군(Pr..
🖥️ IT, 컴퓨터/🐍 Python
2024. 1. 23.
-
[Python] 파이썬으로 기술통계량 확인하기 :: info / describe / unique / value_counts
기술통계량 확인 - 데이터의 통계적 특성을 확인하기 위해 - 연속형 자료: 1. 대표값 (평균 mean/중위수 median) : 해당 연속형 자료를 대표하는 대표값 - 평균의 경우 이상치(Outlier, 데이터 트랜드에 벗어나는 값)에 의해 매우 높게/낮게 계산될 수 있음 A: 1,4,2,3,5 ) 평균 = 3, 중위수 = 3 B: 1,4,2,3,1000) 평균 = 약 200, 중위수 = 3 2. 산포 (분산, 표준편차): 해당 연속형 자료의 대표값으로부터 데이터들이 얼마나 떨어져 있는지 나타내는 통계량 - 대표값에 의해 데이터가 얼마나 정확한지를 나타내는 척도 - 제조업) 데이터의 신뢰성을 나타내기도 함 ex. 제조업의 품질에서는 일정 품질을 위해 분산 너무 크지 않는 것이 중요. - 분산 = 편차제곱..
🖥️ IT, 컴퓨터/🐍 Python
2024. 1. 23.