오늘은 데이터사이언스 및 numpy, 선형대수학을 배웠다.

  1. 데이터 사이언스란
    데이터가 많아져야 힘이 쌔진다
    분석 기술을 배워야 앞으로 나아 갈 수 있다.

  2. 데이터 과학
    다양한 데이터로부터 지식과 인사이트를 추출

  3. 데이터 사이언티스트
    가치를 더할 수 있는 일을 찾고, 데이터를 이용해서 문제를 해결하는 것

  4. 머신러닝
    기계가 스스로 학습해서 규칙을 찾는것
    상태에 따라서 더많은 보상을 받게 에이전트가 하는 행동
    훈련을 통해서 학습능력을 키워간다.

  1. 지도학습
    정답을 알려주고 군집화를 시켜라 라고 시킨다

  2. 비지도학습
    정답이나 해답을 주지 않고 알아서 군집화 시켜라 ,,

  3. 데이터 마이닝
    대규모 저장된 데이터 안에서 체계적인 패턴을 분석해서 가치있는 정보를 추출한다.
    KDD(데이터베이스 속의 지식 발견)

  4. A/B 테스트
    무작위로 A/B로 나눈다.
    각 집단에게 다른종류의 무언가를 보여준다. 표본이 크면 통계적으로 동질한 집단이 된다. 유일하게 달라진것이 다른것을 본것이다. 다른요인을 모두 제외 (RCT)
    최고의 방법이지만 비용이 많이들어서 잘 안쓴다.

  5. 넘파이 = 파이썬 => 여러값을 보관한다

    넘파이 array는 더하기를 하면 인덱스 값끼리 더해져서 나오고 파이썬은 그냥 array가 하나로 합쳐진다
    넘파이는 연산이 가능하고 파이썬은 불가능하다
    넘파이는 문법이 간단하다.

파이썬? => 값을 추가하고 제거할 때
넘파이 => 수치 계산이 많고 복잡할 때, 다차원 배열 사용할 때

profile
smilegate megaport infra

0개의 댓글