데이터 사이언스를 배워야 하는 이유 / 데이터 사이언스 / 오해 / Python / 프로세스
개발 환경 설정 / Jupyter Notebook 설치하기 / 명령 프롬프트로 Jupyter Notebook 설치하기 / Jupyter Notebook 둘러보기 / Cell 다루기 / 설명글 쓰기 / Markdown 정리 / 값 출력하기
Numpy / numpy array의 생김새 / numpy array를 만드는 다양한 방법 / 모듈 별명 지어주기 / 인덱싱, 슬라이싱 / numpy 기본 연산 / numpy 불린 연산 / Python 리스트와 비교 / numpy 기본 통계
Pandas / DataFrame 소개 / DataFrame 사용해 보기 / DataFrame을 만드는 다양한 방법 / Pandas의 데이터 타입 / Pandas로 데이터 읽어들이기
DataFrame 인덱싱 / DataFrame 인덱싱 2 / DataFrame 조건으로 인덱싱 / DataFrame 위치로 인덱싱하기 / DataFrame 인덱싱 문법 정리
DataFrame에 값 변경하기 / DataFrame에 값 추가 및 삭제 / index 및 column 설정하기
큰 DataFrame 살펴보기 / 큰 Series 살펴보기
수강신청 준비하기 / 강의실 배정하기 / 강의실 배정하기2
시각화의 두 가지 목적 / 선 그래프 / 막대 그래프 / 파이 그래프 / 히스토그램 / 산점도
Seaborn 소개 / 확률 밀도 함수 / KDE Plot / KDE 활용 예시 / LM Plot / 카테고리별 시각화
평균값 / 중간값 / 평균값 vs. 중간값 / 상관 계수 / 상관 계수 시각화
EDA란? / 기본 정보 파악하기 / 상관 관계 분석 / 실습 - 스타트업 아이템 탐색하기 / 클러스터 분석
새로운 값 계산하기 / 문자열 필터링 / 문자열 분리 / 카테고리로 분류 / groupby / 데이터 합치기
데이터 퀄리티의 중요성 / 완결성 / 유일성 / 통일성 / 정확성
데이터 클리닝: 완결성 / 유일성 / 정확성
데이터 만들기의 중요성 / 센서 사용하기 / 웹에서 모으기 / 웹 페이지의 구성 / HTML / 기본 HTML 태그 정리 / 서버와 클라이언트 / Python으로 서버에 요청 보내기 / 웹 사이트 주소 이해하기
1
hadoop 명령어 / zookeeper 명령어
빅데이터 수집 - Flume / Kafka
빅데이터 적재 - Hadoop / Zookeeper
HBase / Redis
python
pandas
EDA
실제 데이터 처리
데이터 마인드 building