🌟 학습 목표
데이터 분석과 데이터 과학을 비교하면서 데이터 분석이 무엇일까?
데이터 분석은 서로 비슷하지만 데이터 분석은 비즈니스적인 사고를 더 필요로 하고 데이터 과학은 통계학을 더 필요로 하며 데이터 분석을 어느정도 포함한다고 볼 수 있다. 그리고 데이터 과학은 모델을 만들어내지만 데이터 분석은 의미 있는 결과를 도출한다.
(학습목표 1)
여러 정보 속에서 유의미한 정보를 도출해 내는 것
csv는 데이터가 콤마로 구분되어 있는 파일
xlsx은 표로 보여짐
시리즈
: 배열과 같다고 생각하면 됨
동일 타입만 가능, 순서대로 나열됨
데이터프레임
: 2차원 열과 같다고 생각하면됨
맷플롭립 : 산점도 표시
사이킷런 : 머신러닝에 이용
넘파이 : 행렬이나 일반적으로 대규모 다차원 배열을 쉽게 처리할 수 있도록 지원하는 파이썬의 라이브러리
판다스 : 파이썬 데이터 분석 라이브러리 중 하나로, 데이터 조작, 정제, 분석, 시각화 등을 위한 다양한 기능을 제공, 데이터를 데이터프레임 형식으로 표햔
gdown 패키지 : 대용량 파일을 다운 받을 수 있게 함
함수
read_csv() : csv 파일을 읽음
메소드
to_csv() : csv 파일을 저장함
fit() : 훈련을 돕는 메소드
확인문제 4번 풀고 인증하기
문제
판다스 read_csv() 함수의 매개변수 설명이 옳은 것은 무엇인가요?
header 매개변수의 기본값은 infer이고, CSV 파일의 첫번째 행이 열 이름이 아니고 열 이름이 없는 파일은 경우 header를 0으로 설정하고 names 매개변수에 리스트 형식으로 담는다.
names 매개변수에 열 이름을 리스트로 지정할 수 있다.
3. encoding 매개변수에 CSV 파일의 인코딩 방식을 지정할 수 있습니다.
4 .dtype 매개변수를 사용하려면 모든 열의 데이터 타입을 저장해야 합니다.
dtype 매개변수를 사용하려면 데이터 타입을 지정하고 싶은 열의 이름과 데이터 타입을 저장하면 된다.
남산 도서관 데이터를 데이터 프레임으로 출력하고 화면 캡쳐하기