데이터 분석 1주차 정리

addison·2022년 3월 26일
0

데이터 분석

목록 보기
3/48

데이터 분석 1주차내용

[수업목표]
1. HTML 문서의 개념에 대하여 이해한다.
2. 구글 Colab 사용방법을 익힌다.
3. 태그의 형식에 대해서 이해한다.
4. 크롤링을 위한 패키지 BeautifulSoup4의 사용법을 이해한다.

1. 1주차 배울 것

1) 데이터 분석이란?

💡 현실에 존재하는 실제 문제에 대해 답을 내린다.
근거, 분석하기 위한 바탕, 밑그림에 사용하는 것이 데이터 분석

ex) 판매량 증가의 근거

수업을 통해 얻을 것 (동기부여) :

  • 전체적으로 어떻게 데이터 분석이 진행되는지
  • 진짜 현실에 존재하는 문제에 대해 답을 내리는지
    취업하는 것을 넘어서서 어떻게 문제를 해결할 수 있는지 직접 제한할수 있는 사람 된다는 것. 세상에 대해 기여할수 있구나. 생각해온걸 구현할 수 도 있구나.
  • Collection : 데이터 수집 (ex 기업에 있다면 돈들여서 소비자나 사람들에게 직접적으로 조사나 인터뷰 통해 데이터 모으기. 여건이 안되서 크롤링 기법 : 인터넷에 존재하는, 누군가가 올려놓은 것을 수집해서 분석할 수 있도록 모아놓은 것.) - 1주차
  • Cleaning : 데이터 가공 (약간의 가공은 필요. 원본 데이터 경우 원하는 결과 도출이 어려워. 아예 컴이 분석못하는 경우도 있음. 컴이 분석하도록 가공해서 넣어주는 것) -2주차
  • Exploratory Data Analysis : 탐색적 데이터 분석 (데이터 시각화, 상관관계 분석하여 어떤식으로 데이터들이 연결되어 있는지 확인하는 것.-3주차
  • Model Building : 실제 데이터를 이용해서 예측모델 만들기
  • Model Deployment : 실전처럼 데이터를 토대로 새로운 결과, 인사이트를 도출하는 과정

2) 앞으로 5주 동안 배울 순서

  • 👉 1주차 - 엑셀을 이용해 데이터분석을 맛보고, 본격적으로 파이썬 기초 문법과 웹 스크래핑(크롤링) 하는 방법에 대해 배워봅니다!

    👉 2주차 - 데이터는 보통 그대로 쓰기가 굉장히 어렵습니다. 일종의 가공하는 과정이 꼭 필요한데요, 그것을 위한 텍스트 마이닝 및 텍스트 벡터화에 대해 배워봅니다!

    👉 3주차 - 주류 데이터, 코로나 데이터 등을 활용해 본격적인 탐색적 데이터 분석 과정을 경험해봅시다! 다양한 데이터 시각화 방법에 대해서도 배워봅니다.

    👉 4주차 - 선형 회귀(데이터 예측 방식중 하나로 회귀분석)에 대한 기초를 배우고, scikit-learn이라는 패키지 사용법을 배워봅니다. 이를 통해서 값을 예측하는 머신러닝 모델을 구현해봅니다.

    👉 5주차 - 실전을 가정하고, 고객 데이터를 직접 다뤄볼 겁니다! 이를 통해 고객의 행동을 예측하고, 회원의 탈퇴를 예측해봅시다.

👨‍🏫 목적: 어려운 부분이 있더라도 마지막 까지 달리고 나면 데이터 분석가로써 실제 문제를 어떻게 해결할수 있는지 답을 내릴수 있는 사람이 된다.

💡 [당부 사항]
1. 배속 기능, 스킵 (왕초보 강의라 천천히 설명하고 여러번 해서)
2. 언어같은 파이썬 경우, 직접 입력하고 생각하는 연습 (1주차 안에 이해하기에는 내용이 많다. 언어의 경우 따라치는걸로 끝내지 말고 파이썬을 직접 입력하면서 직접 생각하기.)
ex) 백준 알고리즘이나 등등
3. 누적 복습하기 (내용이 대게 많아서, 한번에 이해하기 어렵다.)
4. 질문 생기면 바로 기록하여 묻기
5. 이해가 안가도 마지막 주차까지 완주하기

0개의 댓글