-
[Python] 피벗테이블 함수 사용 :: .pivot_table(index = , values = , aggfunc = )
* 제품군(Product_Type) 별로 월렌탈비용(Amount_Month) 평균 계산 df1.pivot_table(index = "Product_Type", values = "Amount_Month", aggfunc = 'mean' ) index = 구분하고자 하는 값. df의 index로 잡힘, values = 계산하고자 하는 값, aggfunc = 계산하고자 하는 통계량 * 제품군(Product_Type) 별, 계약 유형(Contract_Type)별 월렌탈비용(Amount_Month) 평균 계산 p1 = df1.pivot_table(index = ["Product_Type", "Contract_Type"], values = 'Amount_Month') p1 #index로 빠져버림. * 제품군(Pr..
🖥️ IT, 컴퓨터/🐍 Python
2024. 1. 23.
-
[Python] 파이썬으로 기술통계량 확인하기 :: info / describe / unique / value_counts
기술통계량 확인 - 데이터의 통계적 특성을 확인하기 위해 - 연속형 자료: 1. 대표값 (평균 mean/중위수 median) : 해당 연속형 자료를 대표하는 대표값 - 평균의 경우 이상치(Outlier, 데이터 트랜드에 벗어나는 값)에 의해 매우 높게/낮게 계산될 수 있음 A: 1,4,2,3,5 ) 평균 = 3, 중위수 = 3 B: 1,4,2,3,1000) 평균 = 약 200, 중위수 = 3 2. 산포 (분산, 표준편차): 해당 연속형 자료의 대표값으로부터 데이터들이 얼마나 떨어져 있는지 나타내는 통계량 - 대표값에 의해 데이터가 얼마나 정확한지를 나타내는 척도 - 제조업) 데이터의 신뢰성을 나타내기도 함 ex. 제조업의 품질에서는 일정 품질을 위해 분산 너무 크지 않는 것이 중요. - 분산 = 편차제곱..
🖥️ IT, 컴퓨터/🐍 Python
2024. 1. 23.
-
[Python] 파이썬에서 list를 정렬하기 :: sorted(), list.sort()
Python에서 list를 정렬하는 방법은 여러 가지가 있습니다. list를 정렬하려면 sorted() 함수나 list.sort() 메서드를 사용할 수 있습니다. 각각의 방법에 대해 간단히 설명해 드리겠습니다. sorted() 함수 사용: sorted() 함수는 새로운 정렬된 리스트를 반환합니다. 원본 리스트는 변경되지 않습니다. my_list = [3, 1, 4, 1, 5, 9, 2, 6, 5, 3, 5] sorted_list = sorted(my_list) print(sorted_list) # [1, 1, 2, 3, 3, 4, 5, 5, 5, 6, 9] list.sort() 메서드 사용: list.sort() 메서드는 원본 리스트를 정렬하며, 새로운 리스트를 생성하지 않습니다. my_list = [3..
🖥️ IT, 컴퓨터/🐍 Python
2024. 1. 17.