🖥️ IT, 컴퓨터/🐍 Python166 [Python] .loc[:,:] :: 데이터프레임의 모든 행과 열 선택하기 loc[:, :]은 데이터프레임의 모든 행과 열을 선택하는 데 사용됩니다.loc은 Pandas 라이브러리에서 데이터프레임의 특정 행과 열을 라벨 기반 인덱싱(label-based indexing) 방식으로 선택할 때 사용하는 메서드입니다. loc은 행과 열의 라벨(이름)을 기준으로 데이터를 선택합니다. loc에 대해 자세히 설명하면 다음과 같습니다:기본 사용법df.loc[row_indexer, column_indexer]row_indexer: 선택할 행을 지정합니다.column_indexer: 선택할 열을 지정합니다.선택 방법행 선택:특정 행을 선택할 수 있습니다.슬라이스(slicing)를 사용하여 여러 행을 선택할 수 있습니다.불리언 배열을 사용하여 조건을 만족하는 행을 선택할 수 있습니다.열 선택:특.. 🖥️ IT, 컴퓨터/🐍 Python 2024. 6. 12. [Python] 판다스의 unstack() 메소드란? :: 멀티 인덱스에서 하나를 열로 만들어줌 unstack() 메소드는 Pandas에서 사용되는 메소드로, DataFrame의 인덱스 레벨을 컬럼으로 변환하여 데이터를 재구조화합니다. 이를 통해 그룹화된 데이터를 보다 쉽게 볼 수 있는 형태로 변환할 수 있습니다. unstack() 메소드를 이해하기 위해, df.groupby(['neighbourhood', 'neighbourhood_group']).price.mean().unstack() 구문을 단계별로 설명하겠습니다.그룹화 및 평균 계산: df.groupby(['neighbourhood', 'neighbourhood_group']).price.mean()df DataFrame을 'neighbourhood'와 'neighbourhood_group' 컬럼으로 그룹화합니다.각 그룹에서 'price'의.. 🖥️ IT, 컴퓨터/🐍 Python 2024. 6. 11. [Python] 판다스 groupby에 쓰이는 집계함수 모음 (sum, mean, min, max / agg...) Pandas의 groupby 객체에 사용할 수 있는 다양한 집계 함수들이 있습니다. 이 함수들은 그룹화된 데이터에 대해 여러 가지 통계적 계산을 수행할 수 있습니다. 주요 집계 함수들은 다음과 같습니다:sum(): 각 그룹의 합을 계산합니다.mean(): 각 그룹의 평균을 계산합니다.median(): 각 그룹의 중앙값을 계산합니다.min(): 각 그룹의 최소값을 계산합니다.max(): 각 그룹의 최대값을 계산합니다.count(): 각 그룹의 요소 개수를 계산합니다.size(): 각 그룹의 크기(요소 수)를 계산합니다.std(): 각 그룹의 표준 편차를 계산합니다.var(): 각 그룹의 분산을 계산합니다.sem(): 각 그룹의 표준 오차를 계산합니다.describe(): 각 그룹의 여러 통계 요약을 제공합.. 🖥️ IT, 컴퓨터/🐍 Python 2024. 6. 11. [Python] 판다스 groupby 함수 groupby는 Pandas 라이브러리에서 제공하는 강력한 함수로, 데이터를 특정 기준에 따라 그룹으로 나누고 그룹별로 연산을 수행할 수 있게 해줍니다. 다음은 groupby 함수의 기본적인 사용법과 예제입니다.기본 사용법groupby를 사용하려면 Pandas 데이터프레임을 특정 열을 기준으로 그룹화하고, 그룹화된 각 그룹에 대해 연산을 수행할 수 있습니다.import pandas as pd# 예제 데이터프레임 생성data = { 'Category': ['A', 'B', 'A', 'B', 'A', 'B'], 'Value': [10, 20, 30, 40, 50, 60]}df = pd.DataFrame(data)# 'Category' 열을 기준으로 그룹화grouped = df.groupby('Ca.. 🖥️ IT, 컴퓨터/🐍 Python 2024. 6. 11. [Python] Pandas DataFrame 열에 접근하는 두 가지 방법: 속성 접근과 딕셔너리 접근 🖥️ IT, 컴퓨터/🐍 Python 2024. 6. 11. [Python] 파이썬 loc, iloc 차이 loc와 iloc는 파이썬의 데이터 분석 라이브러리인 Pandas에서 데이터프레임을 인덱싱하고 선택하는 데 사용되는 두 가지 주요 방법입니다. 이 두 메서드는 데이터를 선택하는 방법에서 차이가 있습니다.locloc는 라벨을 기반으로 데이터를 선택합니다. 이는 데이터프레임의 행 및 열 라벨을 사용하여 데이터를 선택할 수 있게 해줍니다.문법: df.loc[row_labels, column_labels]예시:import pandas as pddata = {'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]}df = pd.DataFrame(data, index=['one', 'two', 'three'])# 'two' 라벨을 가진 행과 'B' 라벨을 가진 열 선택result = d.. 🖥️ IT, 컴퓨터/🐍 Python 2024. 6. 11. [Python] 브이월드 API 이용해 지오코딩하기 ★★★★ 0. 이전 지오코딩 글 이전 지오코딩 관련 글은 아래 참고.내가 시도해본 여러 지오코딩 방법 중 가장 간편한 것 같아서 업로드해본다. https://kimhongsi.tistory.com/entry/R-%EC%B9%B4%EC%B9%B4%EC%98%A4%EB%A7%B5-API%EB%A5%BC-%EC%82%AC%EC%9A%A9%ED%95%B4-%EC%A7%80%EC%98%A4%EC%BD%94%EB%94%A9%ED%95%98%EA%B8%B0-%EC%A3%BC%EC%86%8C%EB%A5%BC-%EA%B2%BD%EC%9C%84%EB%8F%84%EB%A1%9C-%EB%B3%80%ED%99%98 [R] 카카오맵 API를 사용해 지오코딩하기 (주소를 경위도로 변환)오늘은 R로 카카오맵 API를 사용해 지오코.. 🖥️ IT, 컴퓨터/🐍 Python 2024. 5. 26. [Python] HTML에서 특정 클래스 뒤에 있는 텍스트만 추출하기 (BeautifulSoup) 문제 상황 웹에서 제공하는 표의 특정 열 부분만 복사하고 싶은데, 전체 복사만 가능함 문제 해결 개발자도구 > 표 전체를 감싸는 부분 html 코드 찾기해당 부분 우클릭 > copy하기 파이썬에서 아래의 코드 입력, 가정한 HTML 예시에 자신의 코드를 넣기 from bs4 import BeautifulSoup# 가정한 HTML 예시html_content = """ This is an original review. This is a translated review."""# HTML 파싱soup = BeautifulSoup(html_content, 'html.parser')# TranslatedReviewContent 클래스를 가진 div 태그 찾기translated_reviews = soup... 🖥️ IT, 컴퓨터/🐍 Python 2024. 4. 25. [Mecab] 일본어 형태소 분석하기 :: Mecab Mecab으로 일반 텍스트 일본어 형태소 분석하기 ! pip install mecab-python3 ! pip install unidic !python -m unidic download import MeCab import unidic tagger = MeCab.Tagger() # "tagger = MeCab.Tagger('-d ' + unidic.DICDIR)" sample_txt = 'くるまでまつ' result = tagger.parse(sample_txt) print (result) sample_txt에 원하는 문장을 입력하면 くる 動詞,非自立可能,,,カ行変格,連体形-一般,クル,来る,くる,クル,くる,クル,和,"","","","","","",用,クル,クル,クル,クル,"1","C1","",28911744.. 🖥️ IT, 컴퓨터/🐍 Python 2024. 4. 3. [Python] 파이썬 비동기 프로그래밍이란, asyncio 라이브러리 파이썬의 비동기 프로그래밍과 asyncio는 I/O 바운드 작업(예: 네트워크 요청, 파일 읽기/쓰기)을 효율적으로 처리하기 위해 제공되는 기능입니다. 이 기능은 CPU를 기다리는 작업에서 유휴 상태로 두는 대신 다른 작업을 실행하도록 설계되어 있습니다. 아래에서 asyncio와 관련된 핵심 개념, 동작 원리 및 사용 방법을 자세히 설명하겠습니다.1. 비동기 프로그래밍의 기본 개념비동기 프로그래밍은 동시에 여러 작업을 처리하는 방법입니다. 그러나 이는 멀티스레딩이나 멀티프로세싱과 다릅니다. 비동기 프로그래밍은 한 번에 하나의 작업만 실행하지만, 특정 작업이 완료될 때까지 기다리는 동안 다른 작업으로 전환할 수 있습니다.동기 프로그래밍: 작업이 순차적으로 실행. 하나의 작업이 끝날 때까지 다른 작업 대기... 🖥️ IT, 컴퓨터/🐍 Python 2024. 3. 5. [Python] 파이썬에서 환경변수 설정하기 :: os.environ Python에서 os.environ 객체를 사용하여 환경 변수를 설정할 수 있습니다. os.environ은 프로세스 환경을 나타내는 사전(dictionary)-유사 객체로, 이 객체에 새로운 키와 값을 할당함으로써 환경 변수를 만들거나 수정할 수 있습니다. 당신이 제시한 코드 예제는 새로운 환경 변수 NEW_KEY를 만들고, 이 변수에 문자열 'test'를 값으로 할당합니다. 다음은 환경 변수를 설정하는 방법을 보여주는 간단한 예제입니다: import os # 환경 변수 'NEW_KEY'를 'test' 값으로 설정합니다. os.environ['NEW_KEY'] = 'test' # 설정한 환경 변수 값을 확인합니다. print(os.environ.get('NEW_KEY')) 이 코드를 실행하면, NEW_K.. 🖥️ IT, 컴퓨터/🐍 Python 2024. 3. 5. [Python] pd.read_csv 에서 인코딩 설정하는 법 / UnicodeDecodeError pd.read_csv 함수를 사용할 때 인코딩을 설정하는 것은 데이터를 읽어올 때 문자 인코딩 문제를 해결하는 데 매우 중요할 수 있습니다. 특히, 다양한 언어로 된 데이터를 다룰 때, 기본 인코딩인 'utf-8' 외에 다른 인코딩을 명시적으로 지정해야 할 경우가 있습니다. pd.read_csv 함수에서 인코딩을 설정하는 방법은 encoding 매개변수를 사용하는 것입니다. 예를 들어, Excel 파일에서 추출한 CSV 파일이 'utf-8'이 아닌 'cp949' (한국에서 자주 사용되는 인코딩)를 사용하는 경우, 해당 인코딩을 pd.read_csv 함수에 명시해야 합니다. 기본 사용법 import pandas as pd # 'utf-8' 인코딩으로.. 🖥️ IT, 컴퓨터/🐍 Python 2024. 2. 29. 이전 1 2 3 4 5 6 ··· 14 다음 반응형