250311 TIL

수이·2025년 3월 11일
1

🟡 TIL

목록 보기
25/41

팀스터디

아티클스터디

양질의 데이터를 판별하는 5가지방법 : ① 데이터 양은 충분한가?

  • 요약 :
    • 개요
      생각보다 저품질 데이터가 많음
      데이터 수집 및 분석 효율성을 높이기 위해 양질의 데이터를 판별할 수 있어야 함
    • 특징
      • 데이터 수가 충분히 많음 → 이번 아티클 주제
      • 데이터 자체의 오류가 적음
      • 관계형데이터베이스 형식을 잘 지킴
      • 수치형 데이터 형식을 많이 보유
      • 활용 목적에 적합
  • 데이터 양을 중요하게 고려해야 하는 경우
    • 표본이 모집단을 대표하지 못할때
      → 데이터 자체가 너무 적다면 대표성에 대한 의구심
  • AI 알고리즘 적용
    → 데이터가 많을 수록 정밀
  • 어느 정도의 데이터가 충분한 양일까?
    → 절대적인 기준은 없음
    • 통계적인 분석을 할 때는 최소 500개 이상의 데이터
    • 머신 러닝 분야에서는 변수의 수에 100을 곱한 것보다 많은 양의 데이터
  • 주요 포인트 :
    • 양질의 데이터를 가지고 있다 해서 무조건 좋은 인사이트를 얻을 수 있는 건 아니겠지만, 기본적인 신뢰도가 바탕이 되어야 하므로 양 역시 중요하다. 절대적 기준은 없지만, 저자의 경험을 바탕으로 제시한 기준이 감을 잡는 데 도움이 되었다!
    • 막 극단적으로 데이터가 245억개 이렇게 있어도 좋은 건가 싶다가 저장하는 비용이 만만치 않을 것 같은데 현업에서는 어떻게 관리하는지 궁금하다

[공통 인사이트]

분석의 효율성을 위해 양질의 데이터를 찾아가는 과정이 중요하다!

[의미 있었던 의견]

양질의 데이터라는 기준이 모호하다보니 좀 어려웠는데 이번 아티클을 통해 인사이트를 얻었다.

빅데이터라는 말 속에 이미 방대한 양의 데이터라는 의미가 내재되어 있어 처음 데이터 분석을 하는 사람들이 데이터 양을 대수롭지 않게 여기는 것은 사실이다.

개인스터디

데이터 리터러시 1-4

지표

목표 달성을 측정하는 숫자로 된 기준
문제 정의 : 어떤 문제를 풀거냐
지표 설정 : 어떤 결과를 원하냐

예제

1.다음과 같은 목표를 가지고 있을 때 어떻게 지표를 정해야 할지 생각해보아요.
목표 : 날씬해지기

  • 날씬하다는 게 어느 정도 날씬한 걸 말하는 건지?

    • BMI ? 키빼몸? 정상체중 범위?
  • 지표 설정
    운동, 식단

    • 목표 달성량 확인

해설
💡 목표에 대해 더 명확한 정의가 필요해요.
’날씬’을 아래와 같이 정의 해볼 수 있어요.

  • 국가 비만도 정의에 의한 ‘정상’ 체중 (18.5 이상 23 미만)
  • 지표: BMI (체중/키^2)
  • 이상적으로 생각하는 체지방률 (15%)
  • 지표: 체지방률 (체지방량/몸무게)

💡 위에서 설정한 목표치를 달성하게끔 도와주는 액션 관리 지표는 어떻게 만들까요?

  • 수단: 주 5회 이상 운동
  • 지표: 운동이행률 (5일/5일)
  • 매일 7시 이후 금식
  • 지표: 식단달성율 (30일/30일)

2.다음과 같은 목표를 가지고 있을 때 어떻게 지표를 정해야 할지 생각해보아요.
목표 : 사용자 성장

사용자? 어떤 사용자를 얘기하는 건지 모르겠음
만약 어플이라고 치면

  • 지표 : 일 사용 횟수

해설
💡 지표: 사이트 방문자 수

  • 방문자 수는 증가할 수 있지만, 실제 사용자 참여나 수익 창출과는 크게 관련이 없을 수 있음
  • ‘사용자 성장’을 명확하게 정의하지 않음
  • 그럼 무엇이 될 수 있을까요?
    • ex) 평균객단가 증가, 재방문율 증가, …
      • 객단가: 고객 당 평균 구매금액 ( 구매금액의합/고객수)

3.다음과 같은 목표를 가지고 있을 때 어떻게 지표를 정해야 할지 생각해보아요.
목표 : 유튜브 광고에 대한 반응이 적다

  • 광고를 내보낸 것에 비해 어떤 액션이 돌아오지 않는다는 걸로 정의
  • 지표 : 전환율

해설

💡 지표: 문의 수

  • 문의 수가 광고에 대한 반응을 대표하지 못할 가능성이 큼
  • ‘반응이 적다’를 정의
    • 매출이 크게 늘지 않았다.
    • 유입 수가 크게 늘지 않았다.
  • 지표를 정한다면?
    • ex) 매출, 유입 수, …

주요지표

활성유저 Active User

  • 액티브 유저에 대한 정의에 따라 전략 및 방향이 달라짐
  • 사이트 방문한 사람❌❌
  • 기준에 따라 다름
    • 사이트 방문 🫤
    • 추가 행동 (ex. 강의 클릭) 😊
    • 최종 목표 달성 (ex. 결제) 😆❤️‍🔥

이외 주요 지표

재방문율 Retention Ratio

  • 후행지표(사후분석)

  • 서비스를 사용한 사람이 다시 서비스를 사용하는 비율 %

  • 돈 들여서 고객을 데려왔는데 한번 쓰고 떠나면 손해니까 신경써야 함

  • N-Day 리텐션

    • 최초 사용일로부터 N일 후에 재방문한 액티브 유저의 비율
    • 게임, SNS : 습관적으로 쓰는 서비스에 적합
  • Unbounded 리텐션

    • 부동산, 쇼핑몰 : 한 번이라도 다시 오면 인정
  • Bracket 리텐션

    • 일정 구간별 방문율 측정 -> 유저 패턴 파악
    • N-Day 리텐션을 확장한 개념

예제

  1. 위 데이터가 페이스북의 방문자 데이터라고 할때, 어떤 리텐션을 사용해야 할까요?

습관적으로 사용하는 거니까 N-Day 리텐션 사용

  1. 1월 5일의 리텐션을 계산해보세요!

1월 1일에 모두(총 6명) 방문했었는데 1월 5일에 3명만 방문

3/6 = 50%

퍼널 Funnel

  • 고객이 어디서 이탈하는지 추적

    • 광고 봄 → 클릭 → 회원가입 → 구매
    • 단계별 전환율을 분석해 병목구간 해결
  • AARRR

    • 퍼널 활용하는 프레임워크
    • 단계별 전환율 지표화
      • Acquisition: 유입
      • Activation: 활성화
      • Retention: 재방문(재구매)
      • Revenue: 수익
      • Referral: 추천

고객 평생 가치 LTV(Life Time Value)

  • 한 고객이 평생 동안 얼마를 쓰냐

  • LTV가 높다 = 충성도 높은 고객이 많다

  • LTV 높이는 법

    • 객단가(한번에 쓰는 돈) 증가
    • 구매 빈도 높이기
    • 이탈률 줄이기
  • 산출방법이 굉장히 많음
    서비스마다, 관점마다 다르기 때문에 다각도로 고민 필요1

북극성 지표

  • 서비스의 궁국적인 성공을 나타내는 핵심 지표

  • 좋은 북극성 지표 = 비즈니스 성장과 직결

    • 넷플릭스 : 월간 시청 시간 중앙값 > 사용 품질 개선
    • 인스타 : 일간 활성 사용자(DAU) > 유저 사용성 최적화
  • 좋지 않은 북극성 지표

    • 외부 요인의 영향을 많이 받는 지표
    • 측정 불가하고, 기간 설정이 안되는 지표
    • 상황에 따라 위 지표들도 북극성 지표가 될 수 있음

예제

온라인 교육 플랫폼의 북극성 지표를 세운다면?

  • 목표
    사용자가 교육 컨텐츠를 제대로 학습하는 것

  • 사용자
    관심있는 컨텐츠가 있어 공부하러 온 모든 사람들

  • 목표에 가장 크게 영향을 미치는 요소는 무엇일까?
    평균 완강률
    평균 학습시간
    재방문율
    재수강률

데일리퀘스트

Python - 정수 내림차순으로 배치하기
Python - 정수 제곱근 판별
SQL - 취소되지 않은 진료 예약 조회하기
SQL - 루시와 엘라 찾기
SQL - 조건에 맞는 도서 리스트 출력하기


일기

  • SQL 코드카타 40-41, +58✅

  • Python 코드카타 19-20✅ 종합반 2주차 복습

  • 데이터리터러시 1-4 복습+정리✅``1-5 복습

  • 과제 오늘 마무리 해보려고 했는데 한 문제 풀다가 막혔다 아침에 파이썬 코드카타 풀 때 생각보다 시간이 너무 오래 걸려서 괴롭다🤣 내일은 꼭 나머지 문제 더 풀어봐야지

  • 오늘 중간에 소현 튜터님이 방 돌아다니면서 파이썬 과제하면서 궁금한 점은 없는지, 해설할때 뭐가 필요할지 물어보셨는데, 나는 늘 코드를 지저분하게 쓰는 거 같아서 좀 간결하게 표현할 수 있는 법을 같이 설명해주셨으면 좋겠다고 말씀 드렸더니 좋은 의견이라고 하셨다!

    그리고 우리 조 사람들 이름은 한번씩 여기저기서 다 본 것 같다고 여기가 보스방이네 라고 하셔서 뿌듯했음 먼가 내가 느끼는 우리 조 사람들의 이미지와 일치하기 때무네.

    추가로 말씀해주신 것도 도움이 됐다.

지금 다들 어려워하고 고민하는데, 데이터 분석가는 파이썬을 그렇게 쓸 일은 없지만 우리가 언어를 배우는 이상 이 언어가 어떻게 동작하는지 원리를 배우려고 이런 연습들을 하는 것. 이런 것들이 있구나 인지하고 넘어가면 되는 것이고, 이번에는 처음이라 어려운 게 당연하니 너무 골몰하지 말 것!

뭔가 속이 탁 풀렸다. 한 문제 한 문제 풀때마다 사실 나 진짜 박대가리인가 라는 생각을 100번정도 하기 때문에..🤣 다들 어려워 하는 걸 어쨌든 풀고 있으니 그걸로 자신감을 가지고 열심히 해야겠다는 생각을 했다.

  • 또 무슨 일이 있었나를 생각해보면 .. 오늘 좀 많이 웃은듯? 중간중간 졸릴때마다 리프레시 되고 아주좋았다 이벤트가 많았음

  • 마이크 때문에 목소리가 요상해졌는데 막상 들려주려 하니 멀쩡해진 동진님.. (억울하다)

  • 그냥 이건 내가 웃겨서..

  • 갑자기 내가 되어 찾아온 포데이토들과 경우님
    이러고 해인 매니저님 생일 축하해드리러 감
    (생일 축하드려요 🎂)

0개의 댓글

관련 채용 정보