🖥️ IT, 컴퓨터867 [데이터 분석] IT 스타트업에서 Data Analyst가 하는 일 대시보드 제작코호트 분석, 퍼널 분석A/B 테스트AARRR 분석Acquisition(유입) ~ Revenue(수익화)까지 1. 지표 설계 및 모니터링회사나 팀별 KPI(Key Performance Indicator) 설정MAU, DAU, Retention Rate, Conversion Rate 같은 핵심 지표 트래킹'이탈'이나 '구매'처럼 중요한 행동 변화 시그널 감지하기2. SQL 기반 데이터 추출 및 가공서비스 DB(MySQL, PostgreSQL 등)에서 직접 쿼리로 데이터 뽑기ETL(Extract-Transform-Load) 작업해서 분석할 수 있는 형태로 정리3. 사용자 행동 데이터 분석로그 데이터(Clickstream 등)를 분석해 사용자의 행동 경로 파악'어디서 이탈하나?', '어떤 기능을 .. 🖥️ IT, 컴퓨터/📁 데이터 분석 2025. 4. 26. [GenAI] Genspark 젠스파크 https://www.genspark.ai/ 🖥️ IT, 컴퓨터/🤖 GenAI_Tech 2025. 4. 26. [GitHub] 깃허브 Gist 짧은 코드나 메모를 남길 수 있는 서비스 https://gist.github.com/ 🖥️ IT, 컴퓨터/👩🏻💻 IT 2025. 4. 26. [Python] 특정 폴더 내의 모든 파일들의 이름을 csv 파일로 저장하기 위와 같이 많은 파일들의 이름을 리스트업하고 싶다. import osimport csvdef save_file_names_to_csv(folder_path, output_csv): try: file_list = os.listdir(folder_path) with open(output_csv, mode='w', newline='', encoding='utf-8-sig') as file: writer = csv.writer(file) writer.writerow(["파일명"]) # 헤더 for file_name in file_list: writer.writerow([file_name]) .. 🖥️ IT, 컴퓨터/🐍 Python 2025. 4. 24. [Excel] 여러 개의 열 속 텍스트 합치기 문제상황 B2부터 AE2까지의 텍스트를 합쳐야 함.단순히 &로 할 수 있으나 너무 긺 해결방법 =TEXTJOIN("", TRUE, B2:AE2) 함수 입력 🖥️ IT, 컴퓨터/🧮 엑셀 2025. 4. 24. [Python] 유니코드 에러 해결하기 UnicodeEncodeError: 'cp949' codec can't encode character '\xa0' in position 33: illegal multibyte sequenceOutput is truncated. 문제상황 이런 오류가 나오는 상황 해결방법 🔧 해결 방법다음 중 하나의 방법으로 문제를 해결하실 수 있습니다:✅ 1. 인코딩을 utf-8-sig로 변경하기 (추천)df.to_csv(r"C:\Users\jiyun\OneDrive\바탕 화면\LS_빅데이터스쿨_실습셋\실습_3\결과.csv", encoding='utf-8-sig', index=False)엑셀에서도 문제 없이 열립니다.cp949보다 문자 호환 범위가 넓습니다.✅ 2. 특수문자 제거 후 저장하기# 모든 문자열 열에서 비분리 공백(\xa0) 제거df = df.applymap(lambda x: x.replace('\xa0', ' ') if isinstance(x, str) else x)# cp949로 저장df.to_csv(r"C:\Users\ji.. 🖥️ IT, 컴퓨터/🐍 Python 2025. 4. 19. [PPT] 파워포인트에서 배경색 지우기 :: 보라색 배경 하나하나 클릭하는 것보다 더 쉬운 방법이 있다고? 기존 방법 이렇게 보라색 배경이 나오고 하나하나 클릭해줘야 했음 새로운 방법 상단의 색 > 투명한 색 설정 클릭하면마우스 커서 모양이 바뀜.이때 배경 색 클릭하면 깔끔하게 사라짐 🖥️ IT, 컴퓨터/🎨 파워포인트 PPT 2025. 4. 19. [Python] GeoPandas merge가 안 붙을 때? 값이 병합되지 않는 이유와 해결 방법 정리 데이터 분석을 하다 보면 pandas나 geopandas에서 merge()를 사용할 일이 많습니다. 특히 공간 데이터를 다루는 과정에서는 두 데이터프레임을 병합해야 하는 경우가 흔한데요. 오늘은 GeoPandas 병합 시 값이 안 붙는 문제에 대해 원인과 해결책을 정리해봅니다.🔍 문제 상황다음과 같은 코드를 실행했을 때, 병합이 전혀 되지 않는 경우를 겪은 적 있으신가요?격자_생활인구_merged = 격자_50by50.merge(집계구_생활인구수, left_on="grid_to_jgg_cd", right_on="TOT_REG_CD", how='left')하지만 merge 결과를 확인해보면 _merge 컬럼이 다음과 같이 나옵니다:left_only 244416right_only 0b.. 🖥️ IT, 컴퓨터/🐍 Python 2025. 4. 18. [Python] Geopandas로 valid하지 않은 도형 포함한 shp파일을 valid한 것만 남기기 gdf_valid = gdf[gdf.is_valid] 🖥️ IT, 컴퓨터/🐍 Python 2025. 4. 16. [Python] Geopandas로 폴리곤의 중심점(centroid) 계산하기 Python에서 .shp (Shapefile) 파일의 폴리곤 중심점(centroid)을 계산하려면 일반적으로 geopandas 라이브러리를 사용합니다. 아래는 전체적인 절차입니다.✅ 1. 필요 라이브러리 설치 (처음 한 번만)pip install geopandas✅ 2. 코드 예시: 폴리곤의 센트로이드 구하기import geopandas as gpd# SHP 파일 불러오기gdf = gpd.read_file("your_file.shp") # 파일 경로를 적어주세요# 센트로이드 계산gdf['centroid'] = gdf.geometry.centroid# 결과 확인print(gdf[['geometry', 'centroid']].head())# 필요하다면 centroid를 새로운 shp 파일로 저장할 수도 있.. 🖥️ IT, 컴퓨터/🐍 Python 2025. 4. 14. [Python] EDA 시 자주 사용되는 함수 모음 EDA(Exploratory Data Analysis) 단계에서 .shape 외에도 자주 사용되는 Python(pandas 중심) 함수들✅ 1. 데이터 기본 정보 확인함수 설명df.head()상위 5개 행 출력 (데이터 확인용)df.tail()하위 5개 행 출력df.info()열별 타입, 결측치, 데이터 개수 확인df.describe()수치형 변수의 기초통계량 (평균, 표준편차 등)df.columns컬럼명 확인df.index인덱스 확인df.dtypes각 열의 자료형 확인df.memory_usage()메모리 사용량 확인✅ 2. 결측치 / 이상치 확인함수 설명df.isnull().sum()열별 결측치 개수 확인df.isna().mean()열별 결측치 비율 확인df[df.duplicated()]중복 행 확인d.. 🖥️ IT, 컴퓨터/🐍 Python 2025. 4. 14. [GenAI] 지리 공간 추론: 생성형 AI 및 다중 기반 모델을 통한 인사이트 🌍 생성형 AI와 지리공간 추론: Google의 혁신적인 접근Google Research는 최근 생성형 AI와 여러 기반 모델을 결합하여 지리공간 데이터를 분석하고 인사이트를 도출하는 새로운 방법을 소개했습니다. 이러한 접근은 특히 기후 변화 대응, 도시 계획, 재난 관리 등 다양한 분야에서 활용될 수 있습니다.🧠 지리공간 기반 모델의 도입Google은 다양한 지리공간 기반 모델을 개발하여, 위성 이미지, 지도 데이터, 기후 정보 등을 통합 분석할 수 있는 시스템을 구축했습니다. 이러한 모델은 대규모 데이터를 처리하고, 복잡한 지리적 패턴을 이해하는 데 도움을 줍니다.🔗 GeoLM: 지리공간 언어 모델의 혁신GeoLM은 지리공간 데이터를 이해하고 생성할 수 있는 언어 모델로, 다양한 언어와 지역.. 🖥️ IT, 컴퓨터/🤖 GenAI_Tech 2025. 4. 11. 이전 1 2 3 4 5 6 7 ··· 73 다음 반응형