잔차 : 실제값과 예측값의 차이
: MAE
, MSE
, MAPE
, RMSE
, RMSLE
결정계수 : 추정된 회귀식이 변동을 잘 설명한 정도
: 1
에 가까울수록 좋다.
: R^2
, Adjusted R^2
정확도
, 정밀도
, Recall
, F1-Score
, ROC
정확도
, 오차율
상대오차
, 평균 제곱근 편차
평균
, 중앙값
자카드 지수
Dunn Index
, 실루엣 계수
, 팔꿈치 기법
지지도
, 신뢰도
, 향상도
with 최소 기준점
ROI
: 투자 자본에 대한 수익/손실 비율
:(금전적 이익 - 소요비용 / 소요비용) X 100
Heat Map
, Scatter Plot(산점도)
SVM
: 산점도와 구분선을 통한 비교시각화KNN
: 평행좌표계로 변수들 간 연관성, 그룹데이터 경향성 파악Decision Tree
네트워크 그래프
: 연관성 있는 항목끼리 그룹화 - 관계 시각화분석 결과를 쉽게 이해할 수 있도록 도표와 차트를 통한 시각적 표현 및 전달
: 기능적 + 심미적 측면
정보 습득 시간 절감, 데이터에 대한 즉각적 판단
통계적 그래픽 : 2, 3차원에서 데이터 분포 + 통계적 정보 표현
주제 지도학 : 특정 주제의 지리적 분포, 패턴을 지도 형태로 표현
명목형
+ 순서남자 : 1, 여자 : 0
)연속형
+ 형태 + 선 유형시간 데이터
: 막대, 누적막대 그래프, 점, 선 그래프
분포 데이터
: 히스토그램, 파이, 도넛 차트, Tree map
, 누적 연속 그래프
관계 데이터
: 산점도, 버블차트, 히트맵
비교 데이터
: 히트맵, 체르노프 페이스, 스타차트, 평행좌표계, 다차원 척도법
공간 데이터
: 지도 맵핑
데이터 시각화
: 그래픽을 통한 정보에 대한 명확한 ㅍ현정보 시각화
: 데이터 시각화 + 정보 형태 가공
: 큰 범위의 집합에 대한 수치, 비수치적 시각적 표현
묶은 막대 그래프
: 2개 이상 변수에서 첫번째 변수 위치에 나머지 값 표현
: 누적합 / 추이 판단 어려움꺾은선 그래프
: 경향성 뚜렷계단 그래프
: 특정 시점에서의 변화추세선
: 값의 즉각적 변화에 대한 표현X
: 변화의 경향성 표현
1
, 100%
도수분포표
: 데이터 값의 다양한 산출분포
: 일정 범위(계급)에 대한 건수누적히스토그램
: 각 구간값(빈도) 누적
: 마지막(가장 우측) = 전체 데이터 수
Pie Chart
: 데이터 값에 대한 정확한 표현 어려움
: 여러 분류에 대한 값 표현 → 각각의 차트 필요
Donut Chart
: 동일 성격 데이터 = 1 Chart에 중첩 표현
: 길이(면적X)로 값의 정도 표현
x
, y
) + 원의 크기Star Chart
의 여러 축을 평행하게 배치객체 간 근접성 시각화
: 대상 간 거리, 유사성이 클수록 가깝게
유사성 측정 척도
전개 단계 : Deploying
- 개발된 모델을 적용한 결과 확인 및 지속적 관리
- 분석결과 활용 계획 수립
: 분석 결과를 어떻게 업무에 반영할 것인지
: 업무 성과를 지속적으로 모니터링 할 방안 수립
- 분석결과 적용 및 보고서 작성
: 모델, 결과를 업무 현장에 적용
: 성과 측정 지표에 따라 분석 성과 측정 및 개선 계획 수립
- 분석모형 모니터링
: 주변 환경과 데이터 변화를 빅데이터 분석 모델에 지속적으로 반영
- 분석모형 리모델링
: 변화된 업무, 데이터를 지속적으로 수용
: 데이터 품질 검토, 알고리즘 개선, 매개변수 최적화
: 분석데이터를 교체하진 않는다.