데이터 처리 기본

ilysm96·2023년 4월 18일
0

Reward Learning을 써야할 때

  • 정답이 없을 때
  • 사전 데이터가 없을 때
    -variation이 높을때(규칙성이 없고 예측하지 못한 변수가 계속해서 생길 때)
  • 그럼에도 optimum에 도달해야할 때.
  • 없는 데이터와 새롭게 생성된 데이터는 다르다

왜 chat gpt는 데이터분석을 하면 안될까?

  • 가장 큰 문제: 보안

Issue

  • Generalization : 최소 비용 최대 이윤 (많은 사람들이 이익을 얻는 것)
  • Personalization : 개인의 이익을 만족 시키는 것
  • Prediction : 여러 데이터를 가지고 이전 행동들을 발굴해서 예측함
  • Structured Data :

Personalization & Prediction : 한 사람을 기반으로 예측하는 것

유사한 데이터가 없는 경우 추천 시스템

  • Random 추천
  • 그나마 가장 유사한 그룹 추천
  • 기존 데이터에서 새로운 데이터를 발굴한다.

Ai 분석을 실행한다면 정형데이터뿐만 아니라 반정형, 비정형 데이터도 직접 찾거나 만들어 사용해본다. (인터뷰 해보기)

New Data는 어떻게 만드는지?

  • 프로젝트의 goal을 보고 역추적
  • 타분야 이론/현상을 바탕으로 데이터 수집 아이디어 도출(인지과학, 뇌과학, 심리, 사회과학)
profile
안녕하세요 반갑습니다!

0개의 댓글