예시 | 설명 |
---|---|
통계분석 | 데이터의 특성을 살펴보는 기초통계 분석, 가설 검정에 사용되는 고급통계분석 등 다양한 분석 기법에 활용 |
머신러닝 모델링 | - 다량의 데이터를 이용해 특정 변수를 예측할 수 있는 예측 모형을 만드는 기법 - 랜덤포레스트, SVM, 딥러닝 등 최신 머신러닝 알고리즘을 쉽게 활용할 수 있다. |
텍스트 마이닝 | - 문자로 이루어진 데이터 분석 - ex: 문장에서 자주 등장하는 단어 찾기, 감정 나타낸 단어 얼마나 자주 사용되는지 분석 |
소셜 네트워크 분석 | - 트위터, 페이스북과 같은 소셜 네트워크 서비스에서 사람들이 어떤 관계 형성하고 있는지, 어떤 경로로 메시지 퍼져나가는지 분석 |
지도 시각화 | - 위도, 경도 등의 지리 정보와 지역 통계를 활용해 국가별 GDP, 시군구 범죄율 등 지역별 특성을 지도로 표현 |
주식 분석 | - 온라인에서 주식 관련 데이터를 수집해 분석 - 주식투자에 사용되는 지표들 계산하거나 그래프로 표현, 실제 투자에 사용되는 투자 시스템 구축 |
이미지 분석 | - 사진, 그림 등의 이미지에서 속성을 추출해 데이터로 변환 - 추출한 데이터를 이미지 식별 등 영상 처리 알고리즘 개발하는 데 사용 |
사운드 분석 | - 소리 데이터에서 음량, 진폭 등의 속성 추출해 데이터로 변환/시각화 - 음성 인식 등 사운드 처리 알고리즘 개발하는 데 사용 |
웹 애플리케이션 개발 | - 데이터 활용한 웹 애플리케이션 쉽게 개발 가능 이용자가 입력한 값에 반응해 그래프 생성하거나 머신러닝 알고리즘을 적용한 결과 보여주는 등 데이터 분석 기반의 웹 애플리케이션 구현 |
데이터 분석 도구 | 설명 |
---|---|
R | - 데이터 분석용으로 만들어진 언어 - 데이터 처리와 통계 분석 기능에 특화 - 간단한 문법으로 데이터 분석 가능 |
파이썬 | - 소프트웨어를 개발하는데 사용하는 프로그래밍 언어 - 대표적으로 유튜브, 인스타그램, 드롭박스와 같은 웹서비스가 파이썬으로 개발 - 다른 프로그래밍 언어에 비해 데이터를 분석할 수 있는 기능이 잘 구축됨. - 텐셔플로(TensorFlow)처럼 딥러닝을 활용할 수 있는 라이브러리가 등장 |