🖥️ IT, 컴퓨터/🐍 Python172 [Python] 파이썬 열 이름에 특정 문자열 포함된 것만 추출하기 [x for x in p5.columns if 'Rate' in x] 🖥️ IT, 컴퓨터/🐍 Python 2024. 1. 25. [Python] 파이썬 리스트 컴프리헨션 (List Comprehension) 🖥️ IT, 컴퓨터/🐍 Python 2024. 1. 25. [Python] 파이썬에서 특정 문자열 찾아 데이터 변환 :: if in def func3(row): if '서울' in row: return '서울시' if ' 용인' in row: return '용인시' if '성남' in row: return '성남시' if '수원' in row: return '수원시' if '광주' in row: return '광주시' else: return '기타' return row df2['주소'].apply(func3) 🖥️ IT, 컴퓨터/🐍 Python 2024. 1. 25. [Python] 파이썬에서 범주형x범주형 빈도수 계산하기 :: crosstab p2= pd.crosstab(df2['고객등급'], df2['결혼유무']) 🖥️ IT, 컴퓨터/🐍 Python 2024. 1. 25. [Python] 20220101 형식의 데이터를 datetime으로 바꾸기 :: format 활용 첫 번째 사례 공급일자라는 열을 datetime 형식으로 바꾸고 싶다. df_product['공급일자_dt'] = pd.to_datetime(df_product['공급일자'] ,format='%Y%m%d') 두 번째 사례 날짜가 20xx-xx-xx 형식으로 되어있다. df5['날짜_'] = pd.to_datetime (df5['날짜'] ,format= "%Y-%m-%d") format을 "%Y-%m-%d" 로 설정함 🖥️ IT, 컴퓨터/🐍 Python 2024. 1. 24. [Python] 파이썬 데이터프레임의 열 이름 바꾸는 방법 :: .rename, .columns p1.columns = ['회원번호', '총구매금액', '총구매수량'] p3.rename(columns= {'Label' : '총방문횟수'}) Label을 총방문횟수로 변경 🖥️ IT, 컴퓨터/🐍 Python 2024. 1. 24. [Python] Anaconda Prompt에서 파이썬 가상환경 확인/삭제/비활성화 하기 아나콘다 프롬프트에서 가상환경을 확인하고 삭제하는 방법은 다음과 같습니다: 가상환경 확인하기: 아나콘다 프롬프트를 엽니다. 다음 명령어를 입력하여 현재 설치된 모든 가상환경의 목록을 확인합니다: conda env list 또는 conda info --envs 이 명령어들은 설치된 모든 가상환경의 리스트와 그들이 위치한 디렉토리를 보여줍니다. 가상환경 삭제하기: 삭제하고 싶은 가상환경의 이름을 확인합니다. 아나콘다 프롬프트에서 다음 명령어를 입력하여 해당 가상환경을 삭제합니다: conda remove --name [가상환경 이름] --all 여기서 [가상환경 이름] 부분을 삭제하고 싶은 가상환경의 이름으로 대체합니다. 예를 들어, myenv라는 가상환경을 삭제하려면, 다음과 같이 입력합니다: conda r.. 🖥️ IT, 컴퓨터/🐍 Python 2024. 1. 24. [Python] 파이썬의 KeyError 오류 나오는 사례 KeyError: 'Amount_Month' - 데이터 프레임에 해당 열이 없는 경우 - 스펠링 틀린 경우 🖥️ IT, 컴퓨터/🐍 Python 2024. 1. 23. [Python] 파이썬에서 데이터프레임으로 바꾸기 :: pd.DataFrame 대소문자에 주의할 것. df2 = pd.DataFrame( df1["Product_Type"]) df2 🖥️ IT, 컴퓨터/🐍 Python 2024. 1. 23. [Python] 파이썬에서 데이터프레임 정렬하기 :: .sort_values(by = , ascending = ) df1.sort_values(by = "Overdue_count", ascending= False) Overdue_count로 정렬함 ascending = True : 오름차순, False : 내림차순 🖥️ IT, 컴퓨터/🐍 Python 2024. 1. 23. [Python] 데이터 필터링하기 :: .loc - 층별화 : 범주형 데이터의 항목의 특성에 따라, 다른 데이터의 통계적 특성이 달라짐 - 데이터 필터 (Filter) : 특정 조건에 따라 데이터를 나눠 확인, 처리 첫 번째 사례 * 월 렌탈비용이 10만원 이상인 계약 명단을 확인 cond1 = (df1 ['Amount_Month'] >= 100000) df1. loc [cond1] # loc (location): Series에서 True 값으로 잡힌 index에 해당하는 데이터를 추출 df1[cond1] 로도 똑같이 나오지만, loc를 이용하면 파생변수를 만들 수 있음. ex. 10만 이상이면 A, 미만이면 B로 분류하는 모델 -> loc 있어야 만들 수 있음 * 월 렌탈비용은 10만원 이상이고 연체건수는 2건 미만인 계약 명단을 추출 cond1 =.. 🖥️ IT, 컴퓨터/🐍 Python 2024. 1. 23. [Python] 파이썬 결측치 다루기 :: drop / isnull 결측값 처리 - 결측값: 데이터를 수집하거나 처리하는 과정에서 오류나 누락으로 인해 발생한 공백 - 결측값 처리 기법: - 결측값 제거: 결측값이 존재하는 행을 제거 (너무 결측값 많은 열인데 안 중요하면 열 자체를 삭제할 수 있음) - 결측값 대치: 결측값을 다른 값으로 채워넣는 기법. 왜곡될 우려가 있음. 머신러닝에서 사용 - 단순대치: 특정 지정된 값(대표값 또는 상수) 대치 * 항목들 간 연관성이나 상관성이 명확할 때 * 사회과학 데이터 / 병원 ,,, - 알고리즘 대치: KNN 과 같은 머신러닝 알고리즘을 이용해 대치 - 보간법: 특정 간격 사이에 결측치가 있을 때, 간격의 크기대로 결측값을 대치 # 결측값 확인 df1.isnull().sum() 결측치가 많은 열을 제외 df1_clean = d.. 🖥️ IT, 컴퓨터/🐍 Python 2024. 1. 23. 이전 1 ··· 3 4 5 6 7 8 9 ··· 15 다음 반응형