# ELT

18개의 포스트
post-thumbnail

[프로그래머스 데브코스] 데이터 엔지니어링 8주차 월요일 TIL

ETL, ELT, Redshift, 데이터분석/처리용 고급 SQL, BI 대시보드 (1) - 데이터 팀의 역할, 조직 구성원, 데이터 웨어하우스와 ETL/ELT

2023년 11월 27일
·
0개의 댓글
·
post-thumbnail

[DE kit] 3. ETL/Airflow

데이터 파이프라인 (=ETL, 크게 보면 ELT) 데이터 프로세싱을 위해 실행하는 코드 ETL: Extract, Transform and Load Data Pipeline, ETL, Data Workflow, DAG <- 다 동일어 ETL (Extract, Trans

2023년 6월 28일
·
0개의 댓글
·
post-thumbnail

4강. Day 1-3

학습주제학습내용데이터 웨어하우스가 작을 땐 프로덕션 DB이후 클라우드 옵션 사용ResShift, 빅쿼리 등장담점에 대해 논의해본다.클라우드 옵션고정비용 옵션 (redshift)가변비용 옵션 (big query, snowflake)오픈소스는 고정비용에 가깝고정비용은 비용

2023년 5월 24일
·
0개의 댓글
·
post-thumbnail

[데이터 엔지니어링] ETL/ELT

먼저 ETL과 ELT에 대한 설명에 들어가기에 앞서 각각 E, T, L의 개념을 정리해 보자.Extract: 외부의 데이터 소스에서 데이터를 추출하는 단계 Transform: 데이터 포맷을 원하는 형태로 변환 Load: 변환된 데이터를 최종적으로 데이터 웨어하우스에

2023년 5월 22일
·
0개의 댓글
·
post-thumbnail

Data Pipeline

데이터 파이프라인의 정의와 ETL, ELT에 대해 알아보고 비교한다.

2023년 2월 4일
·
0개의 댓글
·
post-thumbnail

[DE] ETL과 ELT의 개념 (+ETLT)

1. ETL 1-1. 정의 ETL 프로세스란 여러 소스에서 데이터를 수집하고, 이를 표준화하여, 분석을 위한 데이터 웨어하우스 또는 저장을 위한 데이터베이스 또는 기타 유형의 데이터 소스에 적재하는 데이터 통합 프로세스이다. 1-2. 단계 E(Extract) : 추출

2023년 1월 25일
·
0개의 댓글
·
post-thumbnail

[DATA] ETL, ELT

어느정도 가치가 있고, 구조화된 데이터들이 모여있는 곳공간제약이 있어 필요한 모든 데이터를 저장하지않고, 어느정도 최근 데이터만 저장BI툴이랑 연결해서 시각화해서 지표계산하는게 일반적이다.데이터웨어하우스 기반 파이프라인보다 훨씬 큰 개념(호수)구조화된 데이터, 비구조화

2023년 1월 3일
·
0개의 댓글
·
post-thumbnail

Cloud Functions - GCS folder trigger

GCS to BigQuery 파이프라인 구축에서 이어지는 내용.앞의 포스팅과 같은 구조에서 'Cloud Storage에 지속적으로 쌓이는 csv파일들이 한 테이블에 계속해서 쌓이게끔 해줄 수는 없는가?'와 같은 요구조건이 있을 수 있다.ex) 한 달치 데이터가 계속해서

2022년 12월 15일
·
0개의 댓글
·
post-thumbnail

Cloud Functions을 사용한 GCS to BigQuery 파이프라인 구축

Cloud Storage에 들어오는 데이터를 빅쿼리로 적재하게끔 트리거를 걸 수 있는 Functions을 테스트해보았다.샘플 데이터는 Sample CSV file 에서 받았다.다운 받은 CSV(633KB)빅쿼리에 데이터 세트와 테이블, Cloud Storage에 버킷을

2022년 12월 12일
·
0개의 댓글
·
post-thumbnail

Cloud Run을 사용한 Pub/Sub to BigQuery 파이프라인 구축

완전 관리형 서버리스 플랫폼에서 원하는 언어(Go, Python, 자바, Node.js, .NET)를 사용하여 확장 가능하고 컨테이너화된 앱을 빌드하고 배포할 수 있는 제품이다.즉, 도커같은 컨테이너만 준비해둔다면 매우 쉽게 해당 어플리케이션을 배포할 수 있는 것이다.

2022년 10월 4일
·
0개의 댓글
·
post-thumbnail

Fluentd와 BigQuery를 사용한 실시간 로그 분석

Fluentd는 로그(데이터) 수집기(collector)다. 보통 로그를 수집하는 데 사용하지만, 다양한 데이터 소스(HTTP, TCP 등)로부터 데이터를 받아올 수 있다.Fluentd로 전달된 데이터는 tag, time, record(JSON) 로 구성된 이벤트로 처

2022년 9월 7일
·
0개의 댓글
·
post-thumbnail

[Week2] (데이터 엔지니어링이란?) 03. Data Pipeline

💡 ETL : Extract / Transform / Load. 다양한 데이터 소스로부터 데이터를 수집 및 처리하는데 사용되는 데이터 파이프라인데이터 분석가들이 분석에 사용할 데이터를 정의하게 되면, 데이터 엔지니어에게 요청을 해서 해당 데이터를 처리해주길 원한다.

2022년 8월 30일
·
0개의 댓글
·
post-thumbnail

Cloud Composer - ELT 파이프라인 구축

Airflow가 지원하는 Operator중 GoogleCloudStorageToBigQueryOperator를 사용해 ELT 파이프라인을 구축해볼 것이다.내 버킷을 하나 생성해준다.git clone으로 해당 리포지토리를 받은 다음 이 파일들을 gsutil cp를 통해

2022년 8월 11일
·
0개의 댓글
·
post-thumbnail

[DE] ETL과 ELT 비교, 5가지 주요 차이점

ETL은 데이터의 추출(Extract), 변환(Transform), 로드(Load) 프로세스를 가리킵니다.ELT는 데이터의 추출(Extract), 로드(Load), 변환(Transform) 프로세스를 가리킵니다.ETL에서 데이터는 데이터 소스에서 스테이징을 거쳐 데이터

2022년 7월 29일
·
0개의 댓글
·

ETL vs ELT

Extract, Transform, Load Extract > 추출 : 데이터를 분석하기 위해 테이블에서 데이터를 가져옴 Transform > 변환 : 데이터를 클라이언트 또는 개발자가 원하는 테이블로 변환 Load > 적재 : 변환 전 또는 후에 데이터를 스토리지에 저장하는 것을 의미함 ETL vs ELT? ETL : 추출 > 변환 > 적재 장점...

2022년 6월 19일
·
0개의 댓글
·
post-thumbnail

ETL / ELT 특성 및 차이점

E / T / L 각각 의미하는 바

2022년 4월 22일
·
0개의 댓글
·

[Read & Ask] How Data engineering works?(Youtube)정리

데이터 엔지니어링 관련 포스팅을 읽고 정리합니다

2022년 1월 10일
·
0개의 댓글
·