[goorm] 클라우드 엔지니어링 프로젝트 과정 2회차 - DAY 12

HAHAHELLO·2025년 5월 12일

오늘의 회고

사용자 행동 데이터 추적

레퍼러 방식과 UTM 파라미터 방식을 비교해 보면, 레퍼러는 단순히 URL 정보로 유입 경로를 추적하는 반면, UTM은 세부적인 캠페인과 매체별로 유입 정보를 분류하고 분석할 수 있다. 특히, UTM 파라미터 방식은 고급 캠페인 성과 분석과 리타겟팅에 유리하다.

레퍼러 기반

레퍼러 방식은 사용자가 현재 웹페이지에 도달하기 전에 방문한 페이지의 URL을 활용하여, 어디서 우리 사이트로 유입되었는지를 파악하는 방법이다. 이 방식은 웹 브라우저가 기본적으로 포함하는 HTTP 헤더를 통해 자동으로 감지된다.
하지만 HTTPS에서 HTTP로 넘어갈 때나, 새 탭에서 링크를 열거나 앱 내 웹뷰에서는 레퍼러 정보가 누락될 수 있다는 단점이 있다. 그럼에도 불구하고, 유입 경로를 자동으로 감지할 수 있다는 장점이 있어 기본적인 트래픽 분석에는 유용하다.

UTM 파라미터 기반

UTM 파라미터 기반은 UTM 파라미터를 URL에 추가하여 트래픽의 출처와 매체, 캠페인 등을 명시적으로 추적하는 방식이다. UTM 파라미터는 utm_source, utm_medium, utm_campaign 등의 값을 사용하여 캠페인별 성과 분석이 가능하다. 이 방식의 가장 큰 장점은 HTTPS/HTTP 관계없이 항상 추적이 가능하며, 광고 소재 단위까지 세부적인 분석을 할 수 있다는 것이다. 이를 통해 캠페인의 효율성을 보다 정밀하게 파악할 수 있다.


UTM 파라미터를 활용하여 어떤 소스에서 유입된 사용자들이 가장 많은 전환을 일으키는지, A/B 테스트 분석을 통해 다양한 광고나 캠페인 소재의 효과를 비교하고 유입 경로 추적을 통해 사용자의 행동을 세밀하게 분석할 수 있다.
더 다양한 방법이 많겠지만 일단은 팀원들과 도입 여부를 의논하고 어떤 식으로 데이터를 활용할 수 있을지 좀 더 알아봐야 할 것 같다.

프로젝트

Kafka KRaft 모드로 메세지를 주고 받는 걸 실습해봤다. 간단한 python 코드로 producer에서 더미 데이터 생성해서 메시지로 보내면 consumer에서 받아서 csv 파일로 저장해봤다. 저장한 파일은 spark로 로드해서 간단한 전처리 후 parquet 파일로 저장해봤다.
spark로 데이터 전처리해보면서 데이터를 어떻게 활용할지 좀 더 생각해 봐야 할 것 같다.
내일은 전체 작업을 airflow로 배치 및 자동화까지 연습해보려고 한다. 이번주까지는 파이프라인 구체적으로 설계하고 금요일에 있을 발표를 잘 마무리하는게 이번주 목표다.

profile
데이터 엔지니어가 되어 봅시다 🌈

0개의 댓글