데이터 분석 및 활용 - 숙명여자대학교 김철연 교수님

이연진·2024년 3월 2일
0

lecture

목록 보기
7/9
post-thumbnail

데이터 마이닝

공학 분야의 핵심 키워드 = 어떻게 하면 생산성을 높일 수 있을 것인가. productive

산업혁명기 = 기존의 생산성의 커브를 뒤흔드는 시기 ex.증기기관

데이터 양 급증(휘발되서 사라질 데이터가 현재 모두 기록이 되는중, 저장기술의 발전에 의한 결과), 과거에 사람이 직접 분석하는 방식으로 부족

데이터 분석을 인간의 영역이 아니라 기계의 영역으로 확대하는 과정

KDD 프로세스

  • 데이터 베이스 > 데이터 클리닝 + 데이터 통합 > 데이터 웨어하우스 > task-relevant 데이터 > 데이터 마이닝 > 패턴 발견 > 지식

KDD 프로세스 ; ML 및 통계의 일반적인 보기

  • 데이터 삽입 > 데이터 전처리 > 데이터 마이닝 > 포스트 프로세싱 > 패턴 정보 지식

데이터 마이닝의 다차원 보기

  • 마이닝할 데이터

  • 데이터 마이닝 기능

  • 활용된 기술

  • 적응된 애플리케이션

머신 러닝 + 패턴 기억 + 통계 + 시각화 + 애플리케이션 + 알고리즘 + 데이터베이스 기술 + 높은 퍼포먼스 컴퓨팅 = 데이터 마이닝

데이터 마이닝 : 흥미로운 패턴과 지식을 발견, 엄청난 양의 데이터

과학 및 정보 기술의 자연적 진화, 수요, 폭넓은 응용

KDD 프로세스에는 데이터 정리, 데이터 통합, 데이터 선택, 변환, 데이터 마이닝, 패턴 평가 및 지식 프레젠테이션

다양한 데이터로 마이닝 가능

데이터 마이닝 기능 : 특성화, 차별, 연관, 분류, 클러스터링, 추세 및 이상값 분석 등

데이터 마이닝 기술 및 애플리케이션

데이터 마이닝의 주요 이슈

0개의 댓글