[내일배움캠프] 데이터 리터러시(완), 직무 스터디(도메인 탐색)

sleekstar·2025년 5월 13일

지표 설정

☑️지표란?

  • 특정 목표나 성과를 측정하기 위한 구체적으로 측정 가능한 기준
  • 목표 달성도를 평가하고 전략적 결정에 필요한 핵심 정보를 제공
  • 정의한 문제를 정확하게 파악하기 위해서 필요

  • 문제 정의를 통해서 ‘어떤 문제를 풀고자 하는가?’를 정의했다면
  • 지표는 ‘어떤 결과를 기대하는가?’에 대한 정량화된 기준

Q: 다음과 같은 상황에서 어떻게 지표를 설정해야 하나?
목표: 날씬해지기
Step 1. 먼저 '날씬'에 대한 구체적인 정의가 필요 (BMI 등)
Step 2. 목표를 달성하게 도와주는 액션 관리 지표를 설정하기
=> Action: 주 5회 이상 운동 / 지표: 운동이행률

주요 지표 이해하기

☑️ Active User (활성유저)

Q: 누구를 우리 서비스만의 '활성유저'로 정의할 것인가?

  • 서비스에 들어오는 모든 유저? x
  • Active User에 대한 정의에 따라 전략과 방향이 달라짐
  • Active User에 대한 정의로 ‘이탈 유저’가 정의됨
  • 투자를 위한 서비스 지표에 중요한 역할을 하게 됨

퍼널 구간에 따른 Active User (사례: 스파르타 코딩클럽)

정밀도, 허들이 높아질 수록 Active User의 수는 낮아지는 구조

☑️ 그 외 주요 지표 정리

☑️ Retention Ratio (재방문율)

몇 %의 유저가 우리 서비스를 다시 사용하는가?
정의: 서비스를 사용한 사람이 다시 서비스를 사용하는 비율
서비스 성장에 있어 매우 중요한 지표

Retention 측정 방법?

1) N-Day 리텐션

-최초 사용일로부터 N일 후에 재방문한 Active User의 비율
-일반적으로 사용함
-게임, 소셜 등 습관적으로 사용하거나 반복적으로 행동을 유도하는 제품에 적합
-유저가 Active User로 집계된 최초 날을 Day 0으로 설정
-Day 0에 액티브 상태가 된 모든 유저들의 N일차 리텐션을 계산
-N-Week, N-Month도 가능
주의: 서비스의 사용 주기가 길 경우, N-day 리텐션을 사용하면 실제보다 과소평가 우려

2) Unbounded 리텐션

-특정 날짜를 포함하여 그 이후에 재방문한 유저의 비율
-특정일을 포함하여 그 이후에 한 번이라도 재방문한 유저의 비율
-유저가 정기적으로 반복해서 방문하는 서비스가 아닐 경우 적합
-해석: Day5는 5일차 이후에 한 번 더 들어온 유저의 비율
-Unbounded 리텐션은 이탈률의 반대 개념
주의: 트렌드를 보는 용도로 활용하는 것을 권장

3) Bracket 리텐션

-설정한 특정 기간을 기반으로 재방문율을 측정
-Bracket 리텐션은 N-Day 리텐션을 확장한 개념 > 일/주/월 단위가 아닌 지정한 구간으로 나눔
-1(0일차) / 2(1-3일차) / 3(4-6일차) / 4(7-11일차)
-활성유저가 특정한 활동을 위해 각 Bracket 내 서비스에 재방문시 잔존 유저로 해석
-서비스 사용주기가 길거나 주기적인 경우 사용하기 적합한 지표

Insight: 리텐션이 높은 세그먼트를 발굴해야 함 / 서비스의 사용 주기에 맞춰 리텐션 조회 기간을 조절해야 함 / 사후 분석에 용이함

☑️ Funnel (퍼널)


유저들이 어디서 이탈하는가?를 확인하기 위한 구조화

☑️ AARRR

  • 디지털 마케팅시 퍼널을 활용하는 프레임워크
  • 단계별 전환율을 지표화 하여 서비스 보완 지점을 찾음
    • Acquisition: 유입
    • Activation: 활성화
    • Retention: 재방문(재구매)
    • Revenue: 수익
    • Referral: 추천

☑️ LTV (Life Time Value, 고객 평생 가치)

  • 해당 유저가 우리에게 평생 주는 이익은 얼마나 될까?
  • 고객 생애 주기: 한 명의 유저가 서비스를 사용하기 시작하여 이탈할 때까지의 기간
  • LTV는 한 명의 유저가 생애 주기 동안 얼마만큼의 이익을 주는지를 정량적으로 지표화 한 것
  • LTV는 유저와의 관계를 측정하고, 이를 사업적 이익으로 가져가는데 중요한 지표
  • LTV가 높다는 것은 해당 서비스와 관계가 좋고, 충성도가 높은 고객이 많다는 것

LTV 산출 방법

- 이익 x Life Time x 할인율(미래 비용에 대한 현재 가치)
- 연간 거래액 x 수익률 x 고객 지속 연수
- 고객의 평균 구매 단가 x 평균 구매 횟수
- (매출액 – 매출 원가) / 구매자 수
- 평균 구매 단가 x 구매 빈도 x 구매 기간
- (평균 구매 단가 x 구매 빈도 x 구매 기간) – (신규 획득 비용 + 고객 유지 비용)
- 월 평균 객단가 / 월 가중 평균 잔존율

LTV를 산출하는 방법은 매우 여러가지이며, 서비스마다, 관점마다 다르기 때문에 다각도로 고민이 필요함=> 단순히 식에 집중하기보다 '왜' 쓰이는지에 집중해야 함.

북극성 지표

=> 서비스의 핵심. 제품 및 서비스의 '성공'을 정의(*선행적 지표)

좋은 북극성 지표 Checklist

  • 유저가 목적을 달성하는 때가 언제인가?
  • 모든 유저가 해당되나?
  • 측정 가능한 지표인가?
  • 측정 주기가 적절한가? (일, 주, 월, …)
  • 외부 요인으로부터 영향을 많이 받진 않는가?
  • 북극성지표의 성장이 사업의 성장과 함께하는가?
  • AARRR 퍼널 전 과정이 북극성 지표에 영향을 주는가?
  • 북극성 지표의 변화가 적어도 매주 관찰가능한가?

북극성 지표의 유형

대표 사례

  • 북극성 지표를 세우기 전에 정리해야 할 것들: 목표 / 사용자 / 목표에 가장 크게 영향을 미치는 요소

결론 도출

Key: 데이터 분석을 통해 얻어진 결과로 어떠한 결론을 낼 것이고, 결론을 내는 것의 의미는 무엇이며, 이 과정은 어떤 방식으로 이루어지는가?

결과: 데이터 처리, 분석, 모델링 후에 얻어진 구체적인 데이터(결과물)
결론: 분석된 데이터 결과를 바탕으로 이끌어낸 의미나 통찰
=>결과-결론 도출 시에는 스토리텔링이 필요하지만, 필요 이상으로 자신의 해석을 융합하면 분석의 품질이 떨어질 수 있음

결론을 잘 정리하려면?

  • 앞서 문제 정의, 지표 설정 단계에서의 목적을 떠올리며 정리
  • 결론을 공유할 대상이 누구이며, 어떻게 변화하길 원하는지 생각하기

결론 정리 Point

1) 단순하고 쉽게 전달: 핵심 지표 위주로 공유, 액션 아이템 제안
2) 흥미 유발: 모든 내용을 전달하기보다, 상대가 궁금해할만한 내용 위주로 공유
3) 대상자 관점에서의 접근: 공유 받는 대상자가 이해하기 쉽도록 정리
4) 시각화 팁: 직관적이어야 함. 대부분 선/ 막대 그래프로 충분.
5) 결론 보고서 플로우: 전체 내용 한 문장 요약->보고서 메인 주제->보고서 작성 이유, 원하는 변화->문제 정의 단계->핵심 내용 전개->결론 및 액션 아이템

결국 데이터 리터러시란?

  • 눈앞에 있는 데이터에 의존하지 않고 스스로 목적과 문제를 정의하는 것
  • 그 목적을 달성하는데 필요한 데이터와 지표를 설정하는 것
  • 데이터를 어떻게 봐야 문제의 정보를 효과적으로 얻을 수 있는지 분석하는 것
  • 단순히 데이터를 보는 방식이나 분석 방법론, 통계지식에 매몰되지 않는 것
  • '왜?'를 항상 생각하기

직무 스터디

내가 관심있는 도메인 찾기

오늘 Zoom에서 진행된 직무 세션을 듣고, 주니어 데이터 분석가는 기술적 역량을 어필하기보다, 어떠한 문제를 해결하려고 노력했는지 그 흔적을 어필하는 것이 더 중요하다는 것을 알게 되었다. 이를 위해서는 내가 관심 있는 도메인을 탐색하여 목표를 구체화하는 단계가 필요할 것이다.
생성형 AI가 하루가 다르게 발전하고 있는 오늘날, 프롬프트 엔지니어링이 유망하지 않을까 생각했다. 그래서 생성형 AI 데이터 분석 도메인을 탐색하게 되었다.

생성형 AI 데이터 분석

주요 기술/스킬: Python, Deep Learning, Machince Learning, 자연어 처리(NLP), 빅데이터 처리
주요 데이터 유형: 텍스트 데이터, 이미지 데이터, 음성 데이터, 비정형 데이터

🧠 이 도메인에서 다루는 것?

  • 프롬프트 실험 결과를 체계적으로 수집·분석
  • 사용자 로그와 LLM 응답 간의 상관관계 분석
  • 생성된 결과물(텍스트·코드·이미지 등)의 품질을 정량적으로 평가
  • 프롬프트 튜닝 및 파인튜닝 결과의 효과 분석

✅ 왜 주목받는가?

  • AI 모델의 활용도를 높이는 핵심 기술로 부상
  • 생성형 AI는 ‘입력에 따라 결과가 확 달라지는’ 기술이라 프롬프트 최적화는 AI의 성능 그 자체와 직결됨
  • 많은 기업들이 ‘AI + 인간 협업’ 구조 속에서 프롬프트 전략가(Prompt Strategist)를 필요로 함

💼 주요 적용 분야

분야프롬프트 엔지니어 활용 예시
게임 개발캐릭터 대화, 세계관 배경 자동 생성
챗봇/고객응대자연스럽고 정확한 응답 설계
교육/튜터링학습 수준별 콘텐츠 생성
마케팅자동 카피라이팅, 이미지 생성
법률/의료리스크 회피 및 정확도 높은 응답 생성

🧪 예시 프로젝트 아이디어

프로젝트 주제분석 포인트
"프롬프트 A와 B 중 사용자 만족도가 높은 건?"사용자 피드백 + 정량 지표 분석
"OpenAI vs Claude 응답 비교 분석"LLM별 응답 구조, 속도, 정확도 비교
"사용자 로그를 기반으로 한 프롬프트 추천 시스템 개발"로그 데이터 → 패턴 추출 → 맞춤 프롬프트 추천
"게임 속 AI NPC 대화 응답 품질 분석"유저 반응 데이터 기반 NPC 응답 개선

💡 데이터 분석과 결합된다면?

  • “어떤 프롬프트가 가장 효과적인가?”를 실험하고 최적화 (A/B 테스트, 피드백 루프 분석)
  • 사용자 반응 데이터 기반 프롬프트 개선
  • LLM 사용 로그 분석 → 사용자 니즈 예측
profile
기록용

0개의 댓글