[이론편]AI 구현 프로세스 - 데이터 분석 및 전처리(1)

Jingu_Jeon·2024년 12월 16일

AICE Basic 공부

목록 보기
14/45

데이터 분석

  • 1. 데이터 타입 확인

    • 데이터 타입 구분하기
        1. 수치형
        • 연속형
          • 연속되는 값
          • 예) 키, 몸무게
        • 이산형
          • 셀수 있는 값
          • 예) 사람 수
        1. 문자형
        1. 범주형
        • 범주를 나눌 수 있는 데이터
        • 사칙연산 X
          • 순서형
            • 순서를 매길 수 있음
            • 예) 학점
          • 명목형
            • 순서를 매길 수 없음
            • 성별, 5지선다 선택지
        1. 불리언형
        • 참, 거짓
  • 기술 통게 확인

    • 기술통계에서 다루는 개념

      • 통계적 방법활용 -> 수집된 데이터 요약 -> 데이터 묘사, 설명 하는 기법을 의미

      • 데이터가 어떻게 모여있는지 표현하는 통계량

        • 개수
          • 데이터의 개수
        • 평균값(Mean)
        • 중앙값(Median)
        • 최빈값(Mode)
      • 데이터가 어떻게 흩어져있는지를 표현하는 통계량

        • 최솟값
        • 최댓값
        • 분산(Variance)
          • 데이터가 평균으로부터 떨어진 정도
          • 차이값의 제곱의 평균
        • 표준편차(Standard Deviaiton)
          • 데이터가 평균으로부터 떨어진 정도
          • 분산의 제곱근
        • 사분위수(Quartile)
          • 모든 데이터를 순서대로 배열 시, 4등분한 지점에 있는 값
        • 첨도(Kurtosis)
          • 데이터의 분포가 정규분포 대비 뾰족한 정도를 나타내는 값
        • 왜도(Skewness)
          • 데이터의 분포가 정규분포 대비 비대칭한 정도를 나타내는 값
profile
Back-end Developer를 목표로 하고 있는 전진구입니다.

0개의 댓글