🖥️ IT, 컴퓨터/🐍 Python189 [Python] 우버의 H3 파이썬 코드 우버가 개발한 H3은 배민에서 배차 시 사용하는 라이브러리임http://webzine.koita.or.kr/202401-specialissue/%EC%A3%BC%EC%9A%B0%EC%95%84%ED%95%9C%ED%98%95%EC%A0%9C%EB%93%A4 (주)우아한형제들 - 기술과혁신 웹진들어가며 디지털 경제의 확장과 팬데믹으로 인한 라이프스타일의 급격한 변화는 우리의 일상을 근본적으로 변모시켰다. 이런 변화의 최전선에는 배달 서비스 산업이 있었으며, 그 결과는 ...webzine.koita.or.kr https://techblog.woowahan.com/2608/ 배달아~ 배달 가는길 알려줘!(단호함) | 우아한형제들 기술블로그서론 배민라이더스에서는 배달거리를 업소와 고객의 주소 정보를 이용해서 지.. 🖥️ IT, 컴퓨터/🐍 Python 2025. 4. 26. [Python] 특정 폴더 내의 모든 파일들의 이름을 csv 파일로 저장하기 위와 같이 많은 파일들의 이름을 리스트업하고 싶다. import osimport csvdef save_file_names_to_csv(folder_path, output_csv): try: file_list = os.listdir(folder_path) with open(output_csv, mode='w', newline='', encoding='utf-8-sig') as file: writer = csv.writer(file) writer.writerow(["파일명"]) # 헤더 for file_name in file_list: writer.writerow([file_name]) .. 🖥️ IT, 컴퓨터/🐍 Python 2025. 4. 24. [Python] 유니코드 에러 해결하기 UnicodeEncodeError: 'cp949' codec can't encode character '\xa0' in position 33: illegal multibyte sequenceOutput is truncated. 문제상황 이런 오류가 나오는 상황 해결방법 🔧 해결 방법다음 중 하나의 방법으로 문제를 해결하실 수 있습니다:✅ 1. 인코딩을 utf-8-sig로 변경하기 (추천)df.to_csv(r"C:\Users\jiyun\OneDrive\바탕 화면\LS_빅데이터스쿨_실습셋\실습_3\결과.csv", encoding='utf-8-sig', index=False)엑셀에서도 문제 없이 열립니다.cp949보다 문자 호환 범위가 넓습니다.✅ 2. 특수문자 제거 후 저장하기# 모든 문자열 열에서 비분리 공백(\xa0) 제거df = df.applymap(lambda x: x.replace('\xa0', ' ') if isinstance(x, str) else x)# cp949로 저장df.to_csv(r"C:\Users\ji.. 🖥️ IT, 컴퓨터/🐍 Python 2025. 4. 19. [Python] GeoPandas merge가 안 붙을 때? 값이 병합되지 않는 이유와 해결 방법 정리 데이터 분석을 하다 보면 pandas나 geopandas에서 merge()를 사용할 일이 많습니다. 특히 공간 데이터를 다루는 과정에서는 두 데이터프레임을 병합해야 하는 경우가 흔한데요. 오늘은 GeoPandas 병합 시 값이 안 붙는 문제에 대해 원인과 해결책을 정리해봅니다.🔍 문제 상황다음과 같은 코드를 실행했을 때, 병합이 전혀 되지 않는 경우를 겪은 적 있으신가요?격자_생활인구_merged = 격자_50by50.merge(집계구_생활인구수, left_on="grid_to_jgg_cd", right_on="TOT_REG_CD", how='left')하지만 merge 결과를 확인해보면 _merge 컬럼이 다음과 같이 나옵니다:left_only 244416right_only 0b.. 🖥️ IT, 컴퓨터/🐍 Python 2025. 4. 18. [Python] Geopandas로 valid하지 않은 도형 포함한 shp파일을 valid한 것만 남기기 gdf_valid = gdf[gdf.is_valid] 🖥️ IT, 컴퓨터/🐍 Python 2025. 4. 16. [Python] Geopandas로 폴리곤의 중심점(centroid) 계산하기 Python에서 .shp (Shapefile) 파일의 폴리곤 중심점(centroid)을 계산하려면 일반적으로 geopandas 라이브러리를 사용합니다. 아래는 전체적인 절차입니다.✅ 1. 필요 라이브러리 설치 (처음 한 번만)pip install geopandas✅ 2. 코드 예시: 폴리곤의 센트로이드 구하기import geopandas as gpd# SHP 파일 불러오기gdf = gpd.read_file("your_file.shp") # 파일 경로를 적어주세요# 센트로이드 계산gdf['centroid'] = gdf.geometry.centroid# 결과 확인print(gdf[['geometry', 'centroid']].head())# 필요하다면 centroid를 새로운 shp 파일로 저장할 수도 있.. 🖥️ IT, 컴퓨터/🐍 Python 2025. 4. 14. [Python] EDA 시 자주 사용되는 함수 모음 EDA(Exploratory Data Analysis) 단계에서 .shape 외에도 자주 사용되는 Python(pandas 중심) 함수들✅ 1. 데이터 기본 정보 확인함수 설명df.head()상위 5개 행 출력 (데이터 확인용)df.tail()하위 5개 행 출력df.info()열별 타입, 결측치, 데이터 개수 확인df.describe()수치형 변수의 기초통계량 (평균, 표준편차 등)df.columns컬럼명 확인df.index인덱스 확인df.dtypes각 열의 자료형 확인df.memory_usage()메모리 사용량 확인✅ 2. 결측치 / 이상치 확인함수 설명df.isnull().sum()열별 결측치 개수 확인df.isna().mean()열별 결측치 비율 확인df[df.duplicated()]중복 행 확인d.. 🖥️ IT, 컴퓨터/🐍 Python 2025. 4. 14. [Python] Dask란? :: Pandas보다 빠르고 큰 데이터도 처리 가능한 라이브러리 💡 Dask란? Pandas보다 빠르고 큰 데이터도 처리 가능한 라이브러리데이터 분석을 하다 보면 Pandas로 처리하기엔 너무 큰 데이터를 다뤄야 하는 순간이 옵니다. 이럴 때 유용한 라이브러리가 바로 Dask입니다.이번 포스팅에서는 Dask란 무엇인지, 왜 필요한지, 기본 사용법과 Pandas와의 차이점을 중심으로 알아보겠습니다.✅ Dask란?Dask는 병렬 컴퓨팅을 지원하는 Python 기반 라이브러리로, Pandas처럼 간단한 문법으로도 수십 GB 이상의 대용량 데이터를 처리할 수 있습니다.즉, Pandas의 사용성을 유지하면서도 더 큰 데이터를, 더 빠르게, 더 유연하게 처리할 수 있도록 도와줍니다.🔍 Dask를 사용해야 하는 이유1. 대용량 데이터 처리Pandas는 메모리(RAM)에 모든 .. 🖥️ IT, 컴퓨터/🐍 Python 2025. 4. 1. [Python] 파이썬 디버깅하기 코드 왼쪽에 마우스 오버하면 중단점 추가 보임클릭하면 빨간 불이 들어옴.빨간 불의 앞쪽까지만 코드가 실행된다는 뜻임 아래 화살표 클릭 시 '디버그 셀' 나옴 디버그 실행 시, 코드 오른쪽에 노란 음영 나오면서 이게 실행되었을 때 어떤 값이 나오는지가 보임 왼쪽에 '조사식' 에 +를 누르면 조사할 식 나옴여기에 내가 궁금한 식을 입력해서 어떤 값이 나오는지 확인 가능path가 뭔지 궁금해서 입력하면 20250101이 나옴 위에 나오는 버튼 확인 가장 우측이 연결 끊기 버튼임 🖥️ IT, 컴퓨터/🐍 Python 2025. 4. 1. [Python] parquet 파일포맷이란? parquet은 Python에서 대용량 데이터 처리와 저장에 효율적인 파일 포맷입니다. 특히 Pandas나 PyArrow를 사용할 때 자주 쓰이며, CSV보다 빠르고 용량도 작다는 장점이 있습니다.다음은 Python에서 parquet 파일을 읽고 쓰는 방법입니다:1. 필요한 라이브러리 설치pip install pandas pyarrow또는 fastparquet을 사용할 수도 있습니다:pip install fastparquet2. Parquet 파일 저장import pandas as pd# 예제 데이터프레임 생성df = pd.DataFrame({ 'name': ['홍길동', '김철수'], 'age': [30, 25]})# Parquet 파일로 저장 (pyarrow 사용)df.to_parquet(.. 🖥️ IT, 컴퓨터/🐍 Python 2025. 3. 31. 파이썬에서 모든 열 출력하기 :: display.max_columns pd.set_option('display.max_columns', None)은 Pandas에서 데이터프레임을 출력할 때 모든 열(column) 을 화면에 표시하도록 설정하는 명령어입니다.의미:pd: 보통 import pandas as pd로 pandas를 불러온 경우를 의미합니다.set_option: pandas의 출력 옵션을 설정하는 함수입니다.'display.max_columns': 출력 시 표시할 최대 열 수를 설정하는 옵션입니다.None: 열 수 제한을 없애고 모든 열을 출력하도록 합니다.사용 예시:import pandas as pdpd.set_option('display.max_columns', None)df = pd.read_csv('example.csv')print(df.head())위 설정.. 🖥️ IT, 컴퓨터/🐍 Python 2025. 3. 31. [Python] SHP 파일 여러개를 하나로 합치는 방법 :: geopandas 활용 Python에서 여러 개의 SHP 파일(서울시 각 지역 데이터)을 하나로 합치는 방법은 매우 일반적인 geopandas 사용 사례입니다. 아래는 그 과정을 단계별로 설명한 코드입니다:✅ 전제모든 SHP 파일은 동일한 컬럼 구조를 가지고 있어야 합니다.좌표계가 다르다면 먼저 동일한 좌표계로 맞춰줘야 합니다. (to_crs 이용)✅ 1. 필요한 라이브러리 설치pip install geopandas✅ 2. Python 코드 예시import geopandas as gpdimport os# SHP 파일들이 저장된 폴더 경로folder_path = "/path/to/shp/files" # 여기를 본인의 경로로 수정# 폴더 내 모든 SHP 파일 경로 불러오기shp_files = [os.path.join(folder.. 🖥️ IT, 컴퓨터/🐍 Python 2025. 3. 27. 이전 1 2 3 4 ··· 16 다음 반응형