[특강] 데이터 응용 유스 케이스 - 한기용 강사님

data_hamster·2023년 5월 12일
0

마케팅을 할 때 데이터가 어떻게 사용되는지?
의료분야에서 데이터가 어떻게 사용되는지? -> 강사님 경험 기반


1년전만 해도 엔지니어를 구인하는 것이 힘들었음.
개발자에게 영어는 중요하긴 하지만, 더 중요한건 코딩하는 능력과. 적극적으로 의사소통하려는 열정. 진성주님은 베짱이 있었음.
서울에서 리모트로 3개월 근무

어떤 무모한 도전. 꿈을 갖고 있는 것. 꿈을 위해 앞으로 나아가는 것.

전공과 상관없는 교육학이었으나, 실리콘벨리 근처에서 석사과정 후 인턴. 그 후 취업.
자기 꿈을 가지고 도전함.


검색엔진에 광고를 붙여서 SEM
유튜브 - 온라인 비디오 광고
이메일 - 개인 특화해서 정보를 보냄
등등
개인정보 보호와 관계되나보니, 리타겟팅은 점점 사라지는 분위기


미디어 하나로 광고하는게 아닌, 다양한 방법으로 광고를 함.
키워드를 구매, 유튜브에 비디오 카테고리에 광고를 삽입. 이미 사용자인 사람들에게 이메일로 광고.
홍보를 노출시키는 접점이 많이 생김.- > 여기에 tracking을 달아서 데이터를 수집
데이터 드리븐 마케팅이 가능해짐.
마케팅 예산 1억이 있다면 1천만원으로 실험. 다양한 미디어에 다양한 캠페인으로 광고 후. 가장 성능이 잘 나오는 캠페인 2개에 몰빵함.
데이터 로깅, 수집이 되는가가 중요해짐. 결과가 빨리 나와야 돈을 바로 집행할 수 있어짐.
유데미에서 한달에 100억, 200억씩 집행했음. 데이터를 보고 모든 판단을 하게 됨.
유데미에서 마케팅했던 분들이 데이터 분석가로 직무전환이 많이 이뤄짐.
데이터로 의사결정이 이뤄지는 마케팅이 우세함.

  • 데이터가 로깅, 수집, 빠른 사이클로 돌아갈 수 있는가가 중요해짐
    조금만 늦어져도 불만이 마케팅 팀으로 부터 들어옴.
    그 전날 마케팅 퍼포먼스는 다음날 오전 10시까지 나온다고 약속함. 99%(아닌 경우도 조금 있음. 이슈 발생 사유로)


모바일 앱의 등장은 수집을 더 복잡해지게 함. 이를 대신 수집해주는 회사들이 많이 생김. MixPanel이 강자로 군림했었음 (대신 가격이 비쌈) 지금은 Amplitude가 가장 큰 회사. 구글 Analytics 같은 느낌. 환경설정을 좀 해주면 사용자의 다양한 이벤트가 로깅이 됨. 트래킹이 가능해짐.
완전 밑바닥부터 데이터 엔지니어들이 수집하진 않음. 백엔드 엔지니어가 어느정도 기초를 닦고, 이를 수집함.
데이터 팀이 생길 경우 주가 되는 업무는 마케팅 관련임. 우리 서비스를 알리려면 광고를 해야하고, 그것과 관련된 데이터들이 로깅, 수집되어야 하기 때문.


접점 = 채널 = 광고 미디어


일부의 사용자가 물건 구매, 회원 가입, 앱 설치를 하게 됨.
그러나 보통 최종 전환이 일어나기 전에 보조 전환이 몇번 일어나게 됨.
최종 전환의 공을 어느 채널에 돌릴 것인가?

구글 키워드 광고를 보고 아무 액션을 취하지 않았으나
페이스북 광고에서 회원가입 액션을 취함
최종적으로 페이스북 광고 이후 회원 가입을 했기 때문에 페이스북 덕분이나 또는
구글 키워드 광고로 유입되었기 때문에 기여도를 주어야 한다.
이는 서비스마다 다름
마지막 채널에 기여도 last touch
처음 유입된 채널에 기여도 first touch
모든 관여 채널에 기여도 multi touch

공을 어떻게 나눌지는 회사의 성격에 따라 다름.
네이버 광고를 보고 상품을 구매함. 앞전의 채널은 직접적으로 관련이 없음. 그냥 네이버 광고에 모든 기여도 가져감.

이를 판단하려면 사용자 A의 기록이 필요함.
데이터가 여러 포인트에서 발생함. 이 정보를 로깅하고, 수집할 수 있어야 함.
-> 이게 너무 복잡해지다보니 수집 대행 회사를 사용하기 시작함.


우리 회사에서 어느 채널이 가장 효과적인지 알아내는게 중요함.
비디오 광고, 이미지 광고를 해볼수도 있고.
디지털 마케팅의 기본 -> 데이터가 기본 -> 데이터 인프라 기본
데이터 엔지니어 없이는 디지털 마케팅을 할 수 없음.


  • Last Touch: 광고를 타고오는게 아니라, 브라우저에서 직접 방문하는 경우, 북마크한 경우도 있음.
  • Last Non-Direct Touch: 위에서 직접방문을 제외
  • First Touch: 처음 방문하게 만들 채널에게 모든 성과 부여
  • Linear 모델: 멀티 터치 모델 중 하나
  • Time Decay: 최근 모델들에게 좀 더 기여도 부여함.
    가격이 싼 물건, 서비스 경우 Last Touch로 감. 유데미의 경우 Last Touch. 사람들이 많이 생각하진 않음.
    가격이 비쌀수록 Linear로 감. 호텔 숙박 등 가격이 비쌀수록 리서치를 많이하게 됨.
    정해진 규칙이 있진 않음. 회사의 업, 마케팅 목표에 따라 연구를 해봐야함.


사용자 1에서 Last Tocuh는 잘 안씀. 마지막 비직접방문 터치 모델 채택, 직접 방문 이전의 방문에 (구글 광고) 기여도 부여. 첫 터치 모델이라면 페이스북에게 모두 기여도.
사용자 2는 모델 관계 없이 유튜브에게


LTV. 이 사용자의 1주일 ~ 1달의 행동을 보고 우리 회사에게 얼마나 돈을 쓸지 예측해봄.
휴리스틱하게 해봄. if문 써서.
한 3년 이상 되면 돈을 소비하는 사용자의 특징이 잡히기 시작함.
채널별로 계산해볼 수 있음. 구글, 유튜브 로 들어온 사람 간 LTV가 어떻게 다른지 볼 수 있음. 단기 매출 뿐만 아니라, 중장기적인 매출 예측.


B2C b2b 건 재구매, 재방문 하는게 중요해짐. (리텐션이라고 함. 지속 가능함)
Churn - 이탈률
데이터가 쌓이면 Churn rate은 머신러닝을 사용하는게 일반적



앱은 갈수록 명확하게 기록이 남지 않음. 앱 자체에서 해결하는 경우가 많아짐.
deep linking이 나왔으나, 표준 없음 애플, ios 호환 안됨.
이에 웹과 앱을 통합한 수집 서비스가 쏟아지는 중
사용자가 항상 디지털에서 물건을 보고 구매하는 것은 아님. 오프라인에서 보고, 체험 후 온라인에서 구매하기도 함.
첫 접점이 오프라인 매장인 경우는 어떻게 tracking 하는가?
Iot 디바이스를 사용, 매장에 사용자가 방문하면 링크를 걸겠다. 등 있었으나 제대로 하는 곳은 없음. 실리콘벨리 Moloco 회사가 시도함. 오프라인 매장과 온라인 매장을 어떻게 연결할 것인가? -> 기술적으로 너무 어려움. 다시 광고로 돌아감. 광고 매칭을 머신러닝으로 해줘 상당한 성과를 내는 중.

아직까지 많은 사람들은 오프라인을 통해 물건을 보는 경향이 있음. Attribution이 명확하지 않음

개인정보보호법이 강화됨.
GDPR -> 강사님이 마지막 6개월 동안 유데미에서 이거만 해결에 매달림. 시스템 내에서 개인정보 제거.
약관에 명시 되지 않은 개인정보 사용으로 엄청난 패널티 - 전체 매출 4%
개인의 정보주체권을 주는 법률.
페이스북, 구글에 가서 지금 내 정보를 어떤걸 갖고 있고, 쓰지 마라 할 수 있음. 내 기록을 보고 추천하지 마라 요구 가능. 이제 서비스 사용 안할테니, 그 기록을 다른 서비스에 넘겨줘.
유데미의 경우 미국 캘리포니아 회사이지만, 유럽 사용자가 많음 -> GDPR 법률 안에 들어가게 됨.
개인 정보의 주체는 개인이다가 강화됨. ChatGPT 관련된 개인보호법, 규제도 유럽에서 나올 예정.

애플 - 2017. 사파리에서 제 3자 쿠키를 중단. 어떤 사이트를 들어가 다른 사이트를 들어갔을 때 그 이전에 봤던 광고들이 따라다녔음. 리타겟팅
구글 - 3년째 연기중. 크롬에서 중단되면 facebook 매출 타격. 대부분이 리타게팅

애플 - 스마트폰에 유일한 식별자 부여. 기본 FA 부여 모든 앱에서 Tracking이 되었는데, 기본으로는 tracking이 안됨. 내가 동의를 명시적으로 해야지 추적 가능.
IDFA.
-> Moloco 회사 부상. 머신러닝을 통해 같은 사람인지 아닌지 어느정도 예측이 가능함. 점점 추세는 개인정보는 tracking을 못하게 하는 쪽


쿠키 - 제 3자 쿠키를 통해 활용

리타겟팅은 디지털 마케팅에서 사용되는 용어로, 이전에 웹사이트나 앱을 방문한 사용자들을 대상으로 광고를 다시 보여주는 기술을 말합니다. 예를 들어, 어떤 웹사이트를 방문한 사용자가 해당 웹사이트에서 상품을 보거나 구매하지 않았을 경우, 리타겟팅을 통해 그 사용자에게 나중에 다시 광고를 보여줌으로써 상품에 대한 관심을 유지하게 하거나 구매 유도를 할 수 있습니다.
제3자 쿠키는 인터넷 사용자의 웹 활동을 추적하고 기록하는 작은 텍스트 파일입니다. 제3자 쿠키는 웹사이트나 앱을 운영하는 회사가 자체적으로 설정한 쿠키가 아니라, 해당 웹사이트나 앱을 이용하는 서드파티 업체가 설정한 쿠키를 말합니다. 제3자 쿠키는 사용자의 행동 패턴, 선호도, 관심사 등을 추적하고 이를 광고 타겟팅 등의 목적으로 활용할 수 있습니다. 그러나 최근에는 개인정보 보호와 관련된 이슈로 인해 제3자 쿠키의 사용이 제한되거나 금지되는 추세입니다.


광고 링크에 여러가지 파라미터가 붙게 됨.
이 파라미터를 보고, 이사람은 어떤채널 어떤 캠페인을 통해왔구나,
그 중 이미지, 텍스트, 영상 등 어떤 content를 구분
이 규약을 디지털 마케팅에서 지킴 - UTM, -> google anlytics만든 회사가 저걸 만듬

주소 뒤에 이렇게 붙어있음. UTM 파라미터가 딸려 붙어오고, 이를 파싱해서 사용함 (15년 됨)


아직 표준은 없음.



ETL 만들게 한두개가 아님. 이를 대행해주는 서비스를 쓰고, 이 서비스를 API로 불러와 사용함.


데이터 엔지니어, 분석가, 마케팅 팀이 협업함.
이탈률: 올헤 페이스북 들어온 사람들을 얼마나 이탈했는가?





1. 기여도 분석
가설 기반, 실험기반으로 어떤 채널이 성과가 높은지.
2. 고객 가치


의료분야 인공지능



의사보다 정확도가 높음.
스마트 디바이스가 있다보니, 개인 건강 관련 정보가 추출됨. 노인들의 경우 혼자 사는 사람이 집에서만 움직이지 않으면 안 좋은 시그널. 얼굴 사진을 보고 우울증 여부를 판단함. 애플 워치로 심박수 등 개인 건강 관련 정보
아직은 의사 - 환자간의 감정 교류가 중요해 완전 대체까지는 시간 있음.


미국의 경우 의료비용이 비싸고 예약이 잘 안됨. 예약하려고 해도 2주 걸림. 지병있는 노인들이 2박 3일 입원하면 1만4천불 정도. 1800만
민영화로 가격이 너무 비싸짐. 전기도 민영화됨. 1년에 3~4번 정전됨.
의료 쪽에서 세상이 발전하는 걸 무시하지 않음. 그러나 한국은 집단 이기주의가 좀 심함. 타다, 의협 등
민영화 -> 돈 없는 사람들 부터 망함.
사람들이 병원을 안가기 시작함. 하루아침에 비대면으로 진료하기 시작. 일전에 기술이 없던건 아님. 굳이 할 이유가 없었음. 사람들이 방문 -> 진료 -> 수술로 돈 벌었음.
돈이 안벌리니 비대면 진료기술을 사용하기 시작함. 의사를 당일날 볼 수 있게됨.
zoom 통해서 대면함.
코로나가 디지털 헬스케어 발전을 앞당김.

65세 이상 노인. 지병 2개 이상 매일 체중, 기본 의료정보 체크 -> 이상 있을 시 주치의에게 경보 날림. 50%만 맞아도 엄청난 saving. 높은 정확도를 필요로 하지 않음.
의사들이 실수하는 것을 막을 수 있음.
형사들이 범죄자를 추정할 때 자기확신이 너무 강하면, 찍고 다른걸 안보는 이슈가 있는데, 의사도 마찬가지임.


환자는 의사와의 교감을 원함.

데이터 문해력 (data literacy)이 중요해짐.
개발자의 ChatGPT 관계와 비슷.
비 IT 도메인에 있던 회사들이 점점 개발자를 쓰기 쉬워짐.
개발도 간단한 개발은 모든 사람이 할 수 있게 되지 않을까? 그럼 개발자들의 하는 일이 바뀌지 않을까? -> 없어지진 않음.


비행기 조종사 역할은 이륙, 랜딩, 비상상황 정도 대처함.
의사도 다양한 대시보드를 보면서 최종 결정의 역할.

의료도 체크리스트를 통한 도움 받기 가능.


데이터의 측정/수집: 예전에는 병원에서만 가능했음 -> 이제 스마트기기로 언제든 디지털로 수집 가능.


미국도 기존 EMR이 있으나, 병원마다 시스템이 다르고, 호환이 안됨.
환자를 위해 만들기 위해서보단 법적으로 패널티 안받으려고 졸속으로 만들어짐. 이상한 시스템이 되어버림. 진료기록을 간호사, 의사가 바로 입력을 안함.
구글이 EMR을 가지고 프로젝트를 해보려다가 포기함. -> 치프 데이터 사이언티스트 한국인. 지금 오늘의 집 맡고 있음.


다양한 버전이 있으나 호환이 잘 안됨. 거진 텍스트화 되어있어서 너무 자유도가 높음


오바마 정부 때 졸속으로 만들어짐.
의료계는 회의적임. EMR을 통해 더 많은 정보를 입력해야되는 거 아닌가. 업무가중.



여러 병원들이 도산함. 병원이 민영화되어 있음.

20년 3월에 코로나 이동통제 후, 바로 비대면 진료 개방


강사님 회사. 다양한 회사들이 존재.
Airvet 회사가 대박침. 자기 목숨을 걸고 애완동물을 데려가진 않아서.
반대로 수의사가 집을 방문하는 서비스는 망했음.


구글은 헤매고 있음

잘 안되서 베릴리 회사로 분리함.

  • 베이스라인 프로젝트
    건강한 사람먼저 수집하자. -> 건강지도
    애플워치 같은 기기 만드는 회사를 인수함. 한국 교포가 시작 -> 구글이 인수

    EMR 관련한 질병예측 -> 포기함

구글 IO도 질세라 엄청 발표했는데 두고 봐야함.


이후 가치가 내려가고 망한 곳 많음




사람이 최종 검수하는 형태로
심장의 경우 뼈가 막고 있음. 이미징 기술이 발전하다보니 심장과 가슴 뼈 사이를 잘 찍어 심장 이미지를 만들어내 심장병 여부를 판별함.

Caption Health FDA 승인 받고 대박침.



트레이닝 셋에 의해 바이어스가 생김
설명하기가 어려움.
환자 관점에서 왜 아픈지 이유를 듣고 싶은데, 치료만 하라고 하면 납득키 어려움
설명을 잘해줘야함.
트레이닝셋이 특정 인종으로 치우쳐져 있는지 않은지? 흑인, 아시아인 등 다른 인종의 오진은?

유럽이 가장 활발함.

개인 의료정보는 동의 없이 유출되선 안됨. 위반시 패널티
MRN은 EMR 마다 다름

이메일, 슬랙에 개인정보 노출되면 난리남.
정말로 필요한 경우가 아니면 저장하지 마라.

한국의 경우


택시기사도 그럼.
뉴욕은 택시기사 라이센스 10억. 그러나 우버 잘 돌아다님

profile
반갑습니다 햄스터 좋아합니다

0개의 댓글