[goorm] 클라우드 엔지니어링 프로젝트 과정 2회차 - DAY 12

HAHAHELLO·2025년 5월 12일
0

오늘의 회고

사용자 행동 데이터 추적

레퍼러 방식과 UTM 파라미터 방식을 비교해 보면, 레퍼러는 단순히 URL 정보로 유입 경로를 추적하는 반면, UTM은 세부적인 캠페인과 매체별로 유입 정보를 분류하고 분석할 수 있다. 특히, UTM 파라미터 방식은 고급 캠페인 성과 분석과 리타겟팅에 유리하다.

레퍼러 기반

레퍼러 방식은 사용자가 현재 웹페이지에 도달하기 전에 방문한 페이지의 URL을 활용하여, 어디서 우리 사이트로 유입되었는지를 파악하는 방법이다. 이 방식은 웹 브라우저가 기본적으로 포함하는 HTTP 헤더를 통해 자동으로 감지된다.
하지만 HTTPS에서 HTTP로 넘어갈 때나, 새 탭에서 링크를 열거나 앱 내 웹뷰에서는 레퍼러 정보가 누락될 수 있다는 단점이 있다. 그럼에도 불구하고, 유입 경로를 자동으로 감지할 수 있다는 장점이 있어 기본적인 트래픽 분석에는 유용하다.

UTM 파라미터 기반

UTM 파라미터 기반은 UTM 파라미터를 URL에 추가하여 트래픽의 출처와 매체, 캠페인 등을 명시적으로 추적하는 방식이다. UTM 파라미터는 utm_source, utm_medium, utm_campaign 등의 값을 사용하여 캠페인별 성과 분석이 가능하다. 이 방식의 가장 큰 장점은 HTTPS/HTTP 관계없이 항상 추적이 가능하며, 광고 소재 단위까지 세부적인 분석을 할 수 있다는 것이다. 이를 통해 캠페인의 효율성을 보다 정밀하게 파악할 수 있다.


UTM 파라미터를 활용하여 어떤 소스에서 유입된 사용자들이 가장 많은 전환을 일으키는지, A/B 테스트 분석을 통해 다양한 광고나 캠페인 소재의 효과를 비교하고 유입 경로 추적을 통해 사용자의 행동을 세밀하게 분석할 수 있다.
더 다양한 방법이 많겠지만 일단은 팀원들과 도입 여부를 의논하고 어떤 식으로 데이터를 활용할 수 있을지 좀 더 알아봐야 할 것 같다.

프로젝트

Kafka KRaft 모드로 메세지를 주고 받는 걸 실습해봤다. 간단한 python 코드로 producer에서 더미 데이터 생성해서 메시지로 보내면 consumer에서 받아서 csv 파일로 저장해봤다. 저장한 파일은 spark로 로드해서 간단한 전처리 후 parquet 파일로 저장해봤다.
spark로 데이터 전처리해보면서 데이터를 어떻게 활용할지 좀 더 생각해 봐야 할 것 같다.
내일은 전체 작업을 airflow로 배치 및 자동화까지 연습해보려고 한다. 이번주까지는 파이프라인 구체적으로 설계하고 금요일에 있을 발표를 잘 마무리하는게 이번주 목표다.

profile
데이터 엔지니어가 되어 봅시다 🌈

0개의 댓글