🖥️ IT, 컴퓨터/🏁 SQL・빅쿼리70 [BigQuery] 빅쿼리의 Geography 데이터 타입 Google BigQuery에서는 GEOGRAPHY라는 데이터 타입을 지원합니다. GEOGRAPHY 데이터 타입은 지리 공간 데이터를 저장하고 쿼리할 수 있도록 도와줍니다. 이 데이터 타입은 지리적 객체를 저장하며, 객체는 다음과 같은 형식으로 표현됩니다:Point (점)LineString (선)Polygon (다각형)MultiPoint (여러 점)MultiLineString (여러 선)MultiPolygon (여러 다각형)예를 들어, 특정 위치의 점을 표현할 때는 다음과 같은 형식으로 사용됩니다:ST_GEOGPOINT(longitude, latitude)그리고 다각형을 표현할 때는 다음과 같은 형식으로 사용됩니다:ST_GEOGFROMTEXT('POLYGON((longitude1 latitude1, lo.. 🖥️ IT, 컴퓨터/🏁 SQL・빅쿼리 2024. 6. 20. [BigQuery] 빅쿼리 별표 와일드카드 역할 BigQuery에서 *(애스터리스크, 별표)는 와일드카드(wildcard) 문자로 사용되어 다양한 상황에서 특정 패턴을 일치시키는 데 사용됩니다. 와일드카드는 문자열이나 테이블 이름의 일부를 대체할 수 있는 문자로, 특정 패턴에 맞는 여러 개체를 선택하거나 필터링할 때 유용합니다.주요 사용 사례와일드카드 테이블:BigQuery에서는 와일드카드 테이블을 사용하여 동일한 스키마를 가지는 여러 테이블을 한 번에 쿼리할 수 있습니다. 주로 날짜나 시간별로 나눠진 파티션 테이블을 한 번에 쿼리할 때 사용됩니다.예를 들어, my_dataset 데이터세트에 sales_20230101, sales_20230102, sales_20230103와 같은 테이블이 있을 때, 이 테이블들을 한 번에 쿼리하고 싶다면 sales_.. 🖥️ IT, 컴퓨터/🏁 SQL・빅쿼리 2024. 6. 20. [BigQuery] 빅쿼리 파티셔닝(Partitioning) vs. 샤딩(Sharding) BigQuery에서 데이터 관리를 최적화하기 위해 사용하는 두 가지 중요한 개념은 샤딩(Sharding)과 파티셔닝(Partitioning)입니다. 이 두 개념은 데이터베이스 성능을 향상시키고, 쿼리 비용을 절감하며, 데이터 관리를 용이하게 합니다. 아래에서 각각의 개념에 대해 자세히 설명하겠습니다.파티셔닝(Partitioning)파티셔닝은 큰 테이블을 더 작은 부분으로 나누는 방법으로, 쿼리 성능을 최적화하고 비용을 절감할 수 있습니다. BigQuery에서는 주로 타임 파티셔닝과 인테저 범위 파티셔닝을 사용합니다.타임 파티셔닝(Time Partitioning):타임스탬프 열 기반: 테이블을 타임스탬프나 날짜 열을 기준으로 일(day), 월(month), 연도(year) 단위로 분할합니다.자동 파티셔닝:.. 🖥️ IT, 컴퓨터/🏁 SQL・빅쿼리 2024. 6. 20. [BigQuery] 빅쿼리 지리함수 documentation https://cloud.google.com/bigquery/docs/reference/standard-sql/geography_functions[Geography functions | BigQuery | Google CloudGoogleSQL for BigQuery supports geography functions. Geography functions operate on or generate GoogleSQL GEOGRAPHY values. The signature of most geography functions starts with ST_. GoogleSQL for BigQuery supports the following functions that can be usedcloud.google.com.. 🖥️ IT, 컴퓨터/🏁 SQL・빅쿼리 2024. 6. 20. [BigQuery] 빅쿼리 파티션 테이블이란? 생성법, 장점, 활용법 BigQuery 파티션 테이블 개요BigQuery에서 파티션을 나눈 테이블은 데이터를 보다 효율적으로 관리하고 쿼리할 수 있게 해줍니다. 큰 테이블을 작은 파티션으로 나누면 쿼리 성능이 향상되고, 데이터 관리가 용이해집니다. [1]BigQuery 파티션 테이블 생성BigQuery에서 파티션을 나눈 테이블을 만드는 과정은 다음과 같습니다:표준 테이블을 만드는 방법과 유사하지만, 파티션 나누기 옵션을 지정해야 합니다.파티션 열은 날짜, 타임스탬프 등 시간 관련 데이터 타입이어야 합니다.파티션 테이블 생성 시 파티션 열, 파티션 유형(일별, 월별 등) 등을 설정할 수 있습니다. [2]파티션 테이블의 장점파티션 테이블을 사용하면 다음과 같은 장점이 있습니다:쿼리 성능 향상: 파티션된 테이블은 필요한 파티션만 스.. 🖥️ IT, 컴퓨터/🏁 SQL・빅쿼리 2024. 5. 26. [BigQueary] 빅쿼리에서 DATE_TRUNC로 날짜 반올림하기 BigQuery에서 DATE_TRUNC 함수는 주어진 날짜를 지정된 날짜 부분까지 절삭하여 표준화된 값을 생성하는 역할을 합니다. 이 함수는 보통 데이터를 그룹화하거나, 특정 시간 간격에 따라 데이터를 분석할 때 유용하게 사용됩니다.예를 들어, DATE_TRUNC 함수를 사용하여 특정 날짜(2023-04-15)의 값을 월 단위로 절삭하고자 할 때, 다음과 같이 사용할 수 있습니다:SELECT DATE_TRUNC('2023-04-15', MONTH) as TruncatedDate이 SQL 쿼리의 결과로 2023-04-01이 반환됩니다. 여기서 DATE_TRUNC 함수는 입력된 날짜의 '일' 부분을 해당 월의 첫 날짜로 설정합니다.또 다른 예로, 연도 단위로 날짜를 절삭하고 싶다면 다음과 같이 할 수 있습니.. 🖥️ IT, 컴퓨터/🏁 SQL・빅쿼리 2024. 5. 26. [SQL] 빅쿼리 CASE문 빅쿼리(BigQuery)에서 CASE 문은 SQL 쿼리 내에서 조건에 따라 다른 결과를 반환하는 데 사용됩니다. CASE 문은 특정 조건들이 참인지를 평가하고, 해당 조건에 맞는 결과를 반환합니다. 기본적으로 다음과 같은 형태를 취합니다:CASE WHEN 조건1 THEN 결과1 WHEN 조건2 THEN 결과2 ... ELSE 기본결과END여기서 조건1, 조건2 등은 평가되어야 할 조건들이며, 각 조건에 해당하는 결과1, 결과2 등은 해당 조건이 참일 때 반환되는 값입니다. 모든 조건이 거짓인 경우 ELSE 절에 지정된 기본결과가 반환됩니다.예제다음은 직원의 연봉에 따라 다른 등급을 할당하는 간단한 예제입니다:SELECT 이름, 연봉, CASE WHEN 연봉 > 100000 THEN '고.. 🖥️ IT, 컴퓨터/🏁 SQL・빅쿼리 2024. 5. 25. [SQL] DISTINCT 오류 :: Syntax error: Expected end of input but got keyword DISTINCT at [1:59] BigQuery에서 "Syntax error: Expected end of input but got keyword DISTINCT at [1:59]" 오류 메시지는 쿼리 구문이 올바르지 않음을 나타냅니다. 이 오류 메시지는 특히 DISTINCT 키워드를 사용할 때 잘못된 위치에 배치하거나, 쿼리의 다른 부분에서 구문적 오류가 있을 때 발생할 수 있습니다. DISTINCT 키워드는 중복 값을 제거하고 유니크한 결과만을 반환할 때 사용됩니다. 일반적으로 SELECT 문의 바로 뒤에 위치해야 합니다. 예를 들어, SELECT DISTINCT column_name FROM table_name; 처럼 사용됩니다. 오류 메시지에서 "[1:59]" 부분은 오류가 발생한 위치를 나타냅니다. 여기서 1은 첫 번째 줄을,.. 🖥️ IT, 컴퓨터/🏁 SQL・빅쿼리 2024. 2. 18. [SQL] Common Table Expression (CTE) CTE는 "Common Table Expression"의 약어로, 데이터베이스에서 쿼리의 일부분을 재사용하거나 복잡한 쿼리를 단순화하는 데 사용되는 임시 결과 집합입니다. CTE는 일시적인 뷰와 비슷한 개념으로 생각할 수 있으며, WITH 절을 사용하여 정의됩니다. CTE는 주로 복잡한 쿼리를 작은 논리적 단위로 분해하여 가독성을 높이고 유지보수를 용이하게 합니다. 또한, CTE를 사용하면 동일한 결과 집합을 여러 번 참조할 수 있으므로 성능 향상에도 도움이 될 수 있습니다. CTE는 임시 테이블로서 메모리에 저장되며, 쿼리의 실행이 완료되면 자동으로 삭제됩니다. 이러한 특성은 CTE를 재사용 가능하고 반복적으로 사용할 수 있는 강력한 도구로 만듭니다. CTE의 구문은 간단하며, WITH 절을 사용하여 .. 🖥️ IT, 컴퓨터/🏁 SQL・빅쿼리 2024. 2. 18. [SQL] 테이블의 열 이름만 추출하기 BigQuery에서 테이블의 열 이름(column names)만을 뽑아내고 싶다면, INFORMATION_SCHEMA.COLUMNS 뷰를 사용할 수 있습니다. 이 뷰는 데이터베이스의 스키마 정보를 제공하며, 테이블에 대한 열의 목록을 조회할 수 있게 해줍니다. 다음 쿼리는 데이터베이스_명.테이블_명 테이블의 모든 열 이름을 조회하는 방법을 보여줍니다: SELECT column_name FROM `데이터베이스_명.INFORMATION_SCHEMA.COLUMNS` WHERE table_name = '테이블_명' 🖥️ IT, 컴퓨터/🏁 SQL・빅쿼리 2024. 2. 15. 이전 1 ··· 3 4 5 6 다음 반응형