[마케팅 기초] 데이터 시각화 및 클러스터링(Clustering) 그리고! 특 강 !

PARK's Marketing & HTML·2022년 6월 20일
0

Ai 프로덕트 마케터

목록 보기
18/62

학습내용

오늘은 데이터 시각화 및 클러스터링에 대해 배웠다.
지난 수업 관련 벨로그는 이 다음 포스트에 포스팅 해야겠다.
오늘 뭔가 어떤일을 했는데 깔끔하게 마무리가 잘되가는 느낌을 받을때는
반드시 해야할 일을 차근차근 짚어보자.
뭔가 매끈하게 이뤄질때는 뭔가 하나를 안했을 가능성이 높다............

우선 pandas를 이용한 기초시각화

아래 코드는 한글폰트가 깨지는 현상을 해결하는 코드이다.

실행 후 런타임 다시시작하고 코드를 한번 더 입력하여 실행.
패키지와 데이터를 다시 로딩한다.

지역명이 경기인 column을 불러온다.

분양가격에 대한 그래프를 kind='line' 선형으로 나타낸다.

figsize로 그래프의 사이즈를 변경한다.

다음은 Plot그래프의 종류이다.
종류가 워낙많다. 예제를 하나씩 했지만 오늘 포스트가 쓸게많다. 검색해보자!

다음은 데이터 시각화 matplotlib과 seaborn 라이브러리이다.
pandas를 import 해준것 처럼 matplotlib을 plt로, seaborn을 sns로 import해준다.

그래프를 만들어본다. x,y축 설정후 데이터를 설정하여 그래프를 만들어 본다.
아래의 파란계열 차트는 palette로 컬러명 PuBu로 컬러 설정 해준다.

근데, 컬러명 PuBu가 아니라 이상한 컬러명을 짓게 되면
아래쪽의 Error코드에 사용할 수 있는 컬러 코드표가 나와있다.


선형 회귀 모형의 개념
표기법 정의
Y : 수치형 관심변수
X : 수치형 설명변수

단순 선형 회귀(simple linear regression)

  • 수치형 관심변수를 수치형 설명변수의 정비례로 설명하는 모형

설명변수 X와 회귀 계수를 활용해서 관심변수 Y를 예측가능


최소 제곱법으로 점과 선사이의 거리를 최소로 만든다.

더 많은 설명 변수를 활용한 회귀모형

p개의 설명변수를 활용가능하다.

t검정 - 실무에서 많이 사용한다.
마케팅에서도 활발하게 이용중이다.
'A/B테스트'라고도 한다

t-검정의 개요
-두개 이하의 집단에서 수치형 변수의 평균의 일치성을 판단하는 기법으로
t-검정이 활용 되며, 크게 두가지로 분류 할 수있다.

독립표본, 대응표본으로 나뉘는데
독립표본은 독립된 두 표본에 평균을 냄.
표본들이 각기 다른 모집단에서 추출이 된다.
예) A통신사와 B통신사 고객들의 하루 평균 통화량 비교

대응표본은 같은 표본을 실험전과 후로 나누어 결과를 본다.
예) A통신사 고객중 S사의 새로운 스마트폰으로 교체한 고객들의
교체 이전과 이후 하루평균 통화량 비교

독립표본 T검정의 개요

  • 두개의 독립된 그룹간의 특정 값의 평균을 비교하기 위한 분석기법
    예를 들어서 온,오프라인 고객의 평균 객단가가 동일한가?
    만약 차이가 있다면 전략을 다르게 세워야한다.
    -> 오프라인이 높으면 오프라인에 가중치를 줘야한다.
    이럴때 사용하는 방법.

t검정을 수행할 경우 결과 해석을 위해 확인해야할 지표중 평균과
pr>ltl (t값에 대한 유의 확률)이 가장 중요

대응표본 T검정의 개요

  • 동일집단의 실험 전과 실험 후 혹은 특정 시점과 그 이후 시점과 같이 쌍체 혹은 대응 표본으로 이루어진 자료의 평균을 비교하기 위한 분석기법
  • 동일한 고객집단의 실험전과 실험 이후의 고객의 반응수치를 비뇨갛고, 실험 전과 후의 평균의 차이가 있는지 확인 해 볼 수 있다.

클러스터링(Clustering)
클러스터 분석이란
주어진 데이터들의 특성을 고려해 그룹을 정의하고, 그룹의 특징을 찾아 내는 데이터 마이닝의 한 방법이다.

  • 클러스터란 비슷한 특성을 가진 데이터 들의 집단이다.

클러스터 집단의 특징
클러스터 내부의 데이터간 유사성이 높다.
클러스터 외부의 데이터간 유사성이 낮다.

원숭이, 팬더, 바나나 중 연관있는 2개를 고른다고 가정하자.

두개의 object 사이의 유사성을 측정하기 위해 두 데이터 사이의 거리를 측정한다.

K-means 클러스터링이란?

  • 주어진 데이터를 k개의 클러스터로 묶는 알고리즘으로, 각 클러스터와 거리 차이의 분산을 최소화 하는 방식으로 동작
  1. cluster의 개수를 k개로 정한다.
  2. k개의 초기 centroid를 랜덤하게 선택
  3. 각각의 데이터에 가장 가까운 centroid에 할당
  4. 같은 centroid에 할당된 object 들의 평균을 구한다.
  5. 평균을 구한 값을 중심으로 다시 클러스터링을 구성한다.

K값은 ?
Inertia value를 활용한다.
inertia 값이 작을수록 군집의 응집도가 높다.

클러스터가 높으면 높을수록 응집도가 작아진다.

일반적으로 inertia는, 가장 급격하게 줄어드는것, 그래프상 갑자기 꺾이는 구간이 엘보우 라는 구간을 찾아내서 군집의 개수로 지정하고 있다.


특강

디지털 콘텐츠 마케팅에 대한 특강을 받았다.

첫째 질문은 컨텐츠란 무엇일까? 였다.
나는 컨텐츠는 특정 내용을 전달하는 목적이라면,
글이나 사진을 적고 올릴때 목적을 생각하지 않고 쓰는것
(홍보의 목적, 내가 글을 쓰는 목적을 염두에 두지말고)
이라고 생각한다.
물론 목적 전달이 가장 중요하지만, 그걸 생각하며 컨텐츠를 만들면
강한 홍보성에 거부감을 느낄 user들이 있을것 같다는 생각이 들어서 이다.

3개 회사의 마케터 모집공고 주요 업무를 한번 확인해 보자.

콘텐츠 마케팅이란 강사님은 이렇게 정의 하셨다.
브랜드가 하는일을 사람들이 콘텐츠로 느끼게끔 하는 것

배달의 민족, 배민 신춘문예 등 모두 바이럴이다.
신춘문예라는 행사는 글귀를 한두줄 적으면 참여가 된다.
간편한 참가 방식에 비해 1등의 보상은 치킨 365마리라고 한다.

치킨 365마리를 사람이 먹을수 있을까 1년동안 하루에 한마리씩 먹어야 하는데?
왠지 난 가능할것 같기도 하지만, 아무튼.
이런 행사에는 의미가 있다고 한다.

한마리 두마리 먹다가 질리면 친구들에게 나눠준다고 한다.
'이거 어디서 났어?'
'어 이거 배민 신춘문예1등해서 받은 치킨인데 먹어봐'
이렇게 해서 받은 사람이 가족들이랑 있을때 쿠폰을 쓰면
'이건 왠 쿠폰이야? 어디서났니?'
'친구가 배민어쩌고 1등해서 받았대요~'
가 된다고 한다. 자연스러운 바이럴 마케팅의 효과다.

배민의 2번째 컨셉인
'좋아하는 음식을 먹고 싶은 곳에서'를 실천하기 위해
음악 페스티벌을 열고 거기서 음식을 제공하는 경험을 하도록 했다고 한다.

경험하게 하는것
지난 과제를 할 때, 왠 문화심리학자가 말했다.
일본에 Lexus 건물 하나가 있다고 한다.
들어가면 차 전시 이런건 없고 그냥 카페가 있다고 한다.
세련된 느낌의 카페와 Lexus 특유의 차량 그릴 디자인을 연상케하는 인테리어로
사람들에게 편안함과 좋은 커피, 다양한 즐길거리 볼거리를 제공한다.
그리고 나가는 길에는 Lexus 차량 체험시승 예약을 할 수 있는 키오스크 단 하나가 있다고 한다.

편안하고 좋은 경험을 만들어 Lexus로 자연스레 유도하는 방식이다.
나는 이 방식이 참 기억에 남았다.

비슷하게 현대 카드에서도 이런 마케팅을 한다.
뮤직 라이브러리와 쿠킹라이브러리 라는게 있다.
뮤직 라이브러리는 진짜 나만큼 음악에 관심이 있는 사람이 아니면
이렇게 꾸미지 못했겠다 라는 생각이 들었다.
쿠킹 라이브러리는 내가 알기로는 향신료도 종류별로 많다고 한다.

그리고 슈퍼콘서트도 현대카드에서 연다. 적고보니 뭐이렇게 많이하나 싶다.
슈퍼콘서트는 현대카드의 섭외 담당자가 일을 잘했다고 생각한다.
콘서트를 또 기획할 즈음 벌어진 재미있는 일이다.
슈퍼콘서트에서는 '브루노 마스'를 섭외하려고 했다.
하지만 담당자가 '이제 우리 콘서트에도 좀더 영향력있는 가수가 필요하다'
무려 브루노 마스 인데? 엥?이게 무슨소리지?라는 반응이 일관되었다.
그리고 담당자는 '폴 매카트니'를 섭외해온다.

현대카드는 정말 많은 방법으로 타게팅을 한다.
다이브라는 앱으로 젊은 층을 타겟팅 하기도 하고,
음식, 음악 등 모든 분야로 마케팅을 정말 많이도 했다.

마지막으로 강사님은
슈퍼 펌프드 : 우버전쟁 이라는 드라마를 소개해주시고 특강은 끝났다.

어려웠던 점

inertia? 설명이 좀더 필요한것 같다.

해결방법

질문이나 검색으로 찾아본다.

학습 소감

오늘 특강이 참 좋았다.
기억에 많이 남는다.
나도 훌륭한 마케터가 될 수 있을까?
잘해보자!

profile
22.03~22.08 대구 Ai스쿨 프로덕트 마케터 과정 수강

0개의 댓글