데이터 수집
탐색
전처리
모델링
대용량의 데이터로부터 관계, 패턴, 규칙등을 찾아내 유용한 지식을 추출하는 과정
샘플링
탐색
보정 (전처리)
모델링
검증
raw data를 테이블화
피처(변수)의 속성 탐색
탐색한 데이터의 시각화
엑셀과 파이썬의 차이점
엑셀은 대용량 데이터에 취약, 엑셀이 제공하지 않는 기능 (머신러닝, 서버) 등 사용이 어려움
구글 코랩 사용예정
구글드라이브 기반으로 브라우저에서 실행 가능
드라이브 마운트하고 my drive 바로 안 보이면 여기에 있음
변수 ; 데이터를 저장하는 공간?!
메모리에 얼마만큼의 공간을 만들지 알려줘야하기 때문에 타입을 나누어놨었음
와 이게 캡쳐가 되네
근데 캡쳐 말고 코드를 올리고 싶은데 노가다일듯 ㅠㅠ
빨리 깃으로 넘어가야게써
