분석 파이프라인
1. 문제 정의: 명확한 '비즈니스 문제' 정의 / 가설 설정
2. 데이터 준비
3. 데이터 분석: 가설 검증
5. 결과 공유: 결과 요약 및 시각화
6. 액션플랜 수립: 분석 결과를 기반으로 실행가능한 마케팅 전략 제시
Yammer는 야머는 기업용 소셜 네트워크 서비스(SNS)이다. 메시지를 공개적으로 내보내는 트위터와는 달리, 폐쇄적인 그룹 내의 구성원들끼리 사내 메신저로 사용할 수 있게 되어 있다 (현재는 마이크로소프트에 인수되어 Viva Engage라는 서비스로 제공되고 있다).
지난 몇 주 동안 주간 활성 사용자 수(WAU) 감소 추세가 확인되었다. WAU는 한 주 간 최소 한 번 이상의 인터랙션 기록이 남아있는 유저의 수로 정의된다.
인터랙션 예시:
먼저 간단한 쿼리(아래)를 통해 WAU를 시각화해보자.
-- Weekly Active Users (WAU)
SELECT
DATE_TRUNC('week' , e.occurred_at) as week,
COUNT(DISTINCT e.user_id) as weekly_active_users
FROM
tutorial.yammer_events e
WHERE
e.event_type = 'engagement'
GROUP BY
DATE_TRUNC('week' , e.occurred_at)
ORDER BY
week;
참고
분석에 사용될 테이블들을 살펴보자. 각 테이블에 대한 자세한 설명은 여기(!)에서 확인할 수 있다. 우리 클라이언트가 미국 기업이라는 전제 하에 번역은 하지 않겠다..
변수명 | 설명 |
---|---|
user_id | A unique ID per user. Can be joined to user_id in either of the other tables. |
created_at | The time the user was created (first signed up) |
state | The state of the user (active or pending) |
activated_at | The time the user was activated, if they are active |
company_id | The ID of the user's company |
language | The chosen language of the user |
변수명 | 설명 |
---|---|
user_id | A unique ID per user. Can be joined to user_id in either of the other tables. |
occurred_at | The time the event occurred. |
event_type | The general event type. There are two values in this dataset: "signup_flow", which refers to anything occuring during the process of a user's authentication, and "engagement", which refers to general product usage after the user has signed up for the first time. |
event_name | The specific action the user took. Possible values include: create_user: User is added to Yammer's database during signup process enter_email: User begins the signup process by entering her email address enter_info: User enters her name and personal information during signup process complete_signup: User completes the entire signup/authentication process home_page: User loads the home page like_message: User likes another user's message login: User logs into Yammer search_autocomplete: User selects a search result from the autocomplete list search_run: User runs a search query and is taken to the search results page search_click_result_X: User clicks search result X on the results page, where X is a number from 1 through 10. send_message: User posts a message view_inbox: User views messages in her inbox |
location | The country from which the event was logged (collected through IP address). |
device | The type of device used to log the event. |
변수명 | 설명 |
---|---|
user_id | The ID of the user to whom the event relates. Can be joined to user_id in either of the other tables. |
occurred_at | The time the event occurred. |
action | The name of the event that occurred. "sent_weekly_digest" means that the user was delivered a digest email showing relevant conversations from the previous day. "email_open" means that the user opened the email. "email_clickthrough" means that the user clicked a link in the email. |
데이터 테이블을 살펴보고 WAU 감소의 원인에 대한 몇 가지 검증가능한 가설을 세워보자.
가능한 여러가지 가설들을 나열해 봤다. 물론, 이 외에도 다양한 가설들이 있을 수 있고, 모든 가설들이 독립적인 것도 아니다. 하나의 가설이 또 다른 가설로 이어질 수도 있기 때문이다. 예를 들어, "신규 유저 유입이 감소했다"는 가설이 참이라고 할 때, 그에 대한 후속 가설로 "웹사이트 셧다운으로 인한 트래픽 감소", 또는 "마케팅 이벤트 종료로 인한 트래픽 감소" 등이 제시될 수 있는 것이다.
중요한 것은 데이터로 검증이 가능한 가설들의 목록을 만들어보고 우선순위에 따라 문제를 구체화 시키는 작업이다. 우선순위 선정에는 다음과 같은 방법이 있다:
다음 포스트에서는 몇 가지 확인이 가능한 가설들을 살펴보겠다.