[혼공데분] 1주차 활동일지

고태경·2024년 1월 7일
0
post-thumbnail

CHAPTER 01 데이터 분석을 시작하며

🌟 학습 목표
데이터 분석과 데이터 과학을 비교하면서 데이터 분석이 무엇일까?

데이터 분석과 데이터 과학

데이터 분석은 서로 비슷하지만 데이터 분석은 비즈니스적인 사고를 더 필요로 하고 데이터 과학은 통계학을 더 필요로 하며 데이터 분석을 어느정도 포함한다고 볼 수 있다. 그리고 데이터 과학은 모델을 만들어내지만 데이터 분석은 의미 있는 결과를 도출한다.
(학습목표 1)

데이터 분석

여러 정보 속에서 유의미한 정보를 도출해 내는 것

CSV vs xlsx

csv는 데이터가 콤마로 구분되어 있는 파일
xlsx은 표로 보여짐

시리즈와 데이터프레임

시리즈
: 배열과 같다고 생각하면 됨
동일 타입만 가능, 순서대로 나열됨

데이터프레임
: 2차원 열과 같다고 생각하면됨

데이터 분석과 관련 있는 파이썬 패키지

맷플롭립 : 산점도 표시
사이킷런 : 머신러닝에 이용
넘파이 : 행렬이나 일반적으로 대규모 다차원 배열을 쉽게 처리할 수 있도록 지원하는 파이썬의 라이브러리
판다스 : 파이썬 데이터 분석 라이브러리 중 하나로, 데이터 조작, 정제, 분석, 시각화 등을 위한 다양한 기능을 제공, 데이터를 데이터프레임 형식으로 표햔

실습 패키지 및 메소드, 함수

gdown 패키지 : 대용량 파일을 다운 받을 수 있게 함

함수
read_csv() : csv 파일을 읽음

메소드
to_csv() : csv 파일을 저장함
fit() : 훈련을 돕는 메소드

확인문제

기본 미션

확인문제 4번 풀고 인증하기

문제
판다스 read_csv() 함수의 매개변수 설명이 옳은 것은 무엇인가요?

  1. header 매개변수의 기본값은 1로 CSV 파일의 첫 번쨰 행을 열 이름으로 사용합니
    다.

header 매개변수의 기본값은 infer이고, CSV 파일의 첫번째 행이 열 이름이 아니고 열 이름이 없는 파일은 경우 header를 0으로 설정하고 names 매개변수에 리스트 형식으로 담는다.

  1. names 매개변수에 행 이름을 리스트로 지정할 수 있습니다.

names 매개변수에 열 이름을 리스트로 지정할 수 있다.

    3. encoding 매개변수에 CSV 파일의 인코딩 방식을 지정할 수 있습니다.

    4 .dtype 매개변수를 사용하려면 모든 열의 데이터 타입을 저장해야 합니다.

dtype 매개변수를 사용하려면 데이터 타입을 지정하고 싶은 열의 이름과 데이터 타입을 저장하면 된다.

선택 미션

남산 도서관 데이터를 데이터 프레임으로 출력하고 화면 캡쳐하기

profile
컴퓨터정보과

0개의 댓글