쿼리 플랜(Query Plan) 위키백과쿼리 플랜(query plan) 또는 쿼리 실행 계획(query execution plan)은 SQL 관계형 데이터베이스 관리 시스템의 데이터 접근에 사용되는 순서가 있는 단계별 집합이다.SQL이 선언형이기 때문에 주어진 쿼리를
테이블의 전체 레코드를 대상으로 특정 컬럼을 적용해서 한 개의 값을 리턴하는 함수이다.집계함수에는 대표적으로 COUNT(), SUM(), AVG(), MIN(), MAX() 등이 있다.1\. COUNT() : 지정된 기준과 일치하는 레코드 개수를 반환한다. 2\.
JOIN문? > 여러 테이블에 흩어져 있는 데이터를 연관짓기 위해 사용한다. 각 테이블에는 매칭할 수 있는 'key column'이 있어야 한다. 즉 여러 개의 테이블을 연관지어 데이터를 조합하고 하나의 테이블로 표현하기 위한 수단이다. JOIN문의 default 값
BigQuery란 대용량 데이터 셋( 테이블 이름 Project ID: 구글 클라우드 프로젝트의 ID이다. Dataset ID: 주어진 클라우드 프로젝트 내에서 고유한 BigQuery 데이터 셋 ID이다. Table ID: 지정된 데이터 셋 내에서 고유한 BigQue
NET.HOST BigQuery > Net 함수 (공식 문서) > URL을 STRING으로 취해 호스트를 STRING으로 반환한다. 최상의 결과를 위해서는 URL 값이 RFC 3986 에 정의된 형식을 준수해야 한다. 함수에서 입력을 파싱하지 못랄 경우에는 NULL을
UDF란? UDF(User Define Function)이란 SQL에서 사용자가 정의한 함수를 의미한다. UDF 종류 Temp UDF : 쿼리문 위에 정의해서 사용하는 방식이다. Persistent UDF : BigQuery의 데이터셋에 저장해서 사용하는 방식으로 여
Redis 접속 시 옵션 설정 > 기본적으로 python에서 redis에서 정보를 get 해올 때, b''로 값이 출력된다. 이때 b의 의미와 이걸 제거하고 값만 출력하도록 옵션 설정을 한다. --- Reference https://zedo.tistory.com
PID란? PID(ProcessID/Process IDentification number)는 운영체제에서 프로세스를 식별하기 위해 프로세스에 부여하는 번호를 의미한다. 이때 Python으로 서비스 혹은 데몬을 구동할 때 구동되고 있는 PID값이 필요한 경우가 있다. 확
수치 데이터를 다룰 때 NULL과 0이 나오는데 NULL과 0은 의미가 다르며 다룰 때 주의해야 합니다. 특히 수학적 통계적으로는 이 차이는 매우 중요합니다. NULL과 0의 차이를 공부해서 기억하는 것이 좋습니다. DB(SQL을 사용하는 것들)에서 NULL과 0은 조
1. ETL 1-1. 정의 ETL 프로세스란 여러 소스에서 데이터를 수집하고, 이를 표준화하여, 분석을 위한 데이터 웨어하우스 또는 저장을 위한 데이터베이스 또는 기타 유형의 데이터 소스에 적재하는 데이터 통합 프로세스이다. 1-2. 단계 E(Extract) : 추출