데이터 마이닝

AI Scientist를 목표로!·2023년 1월 6일
0

데이터 마이닝이란?

  • 데이터를 탐색하고 분석하여 의미 있는 패턴이나 규칙을 발견하는 것

  • 결과를 예측하기 위해 대량의 Dataset에서 이상점(Anomalies), 패턴 및 상관관계를 찾아내는 프로세스

  • 데이터 마이닝의 근간에는 통계, 인공지능, 머신러닝이라는 3개의 긴말한 과학 분야로 구성

  • 빅데이터의 무한한 잠재력과 경제적인 컴퓨팅 기능에 발맞춰 진화를 거듭하면서 새로운 기술로 자리 매김


데이터 마이닝의 활용분야

  1. DB 마케팅 (DataBase Marketing)
  • 타겟 마케팅(Target Marketing)
  • 고객 세분화(Segmentation)
  • 이탈 고객 분석(Churn Analysis)
  • 장바구니 분석(Market Basket Analysis)
  • 추천 시스템(Recommendation System)
  1. 신용 평가 (Credit Scoring)
  • 특정인의 신용상태를 점수화
  • 신용거래 대출한도를 결정
  • 불량채권과 대손을 추정하여 최소화
  1. 생물정보학 (Bioinfomation)
  • 유전자 정보로 부터 가치 있는 정보 추출
  • 신약 개발, 조기진단, 유전자 치료
  1. 텍스트 마이닝 (Text Mining)
  • 디지털 자료로 부터 정보 획득
  • 자동응답시스템, 소셜미디어 분석, 상품평 분석

데이터 마이닝의 방법론

  1. 회귀분석(regression analysis): 선형회귀모형, 변수선택, 로지스틱 회귀
  2. 모형평가(model assessment): 모형들의 예측성능을 평가하는 방법
  3. 의사결정나무(decision trees)
  4. 신경망(neural networks)
  5. 기타 지도학습기법: 단순 베이즈 분류(naive Bayes classifier), k-Nearest classifier, SVM
  6. 차원축소기법: 주성분분석(principal component analysis), 인자분석(factor analysis), 다차원 척도법(multidimensional scaling)
  7. 연관규칙분석(association rule analysis)
  8. 군집분석(cluster analysis): k-Mean(k-means clustering), 계층적 군집법(hierarchical clustering)
profile
딥러닝 지식의 백지에서 깜지까지

0개의 댓글