EDA(Exploratory Data Analysis)

최민석·2021년 7월 12일
0

data science

목록 보기
1/12

pandas

pandas는 데이터 조작 및 분석을 위해 Python 프로그래밍 언어로 작성된 소프트웨어 라이브러리입니다. 특히 숫자 테이블과 시계열을 조작하기위한 데이터 구조와 연산을 제공합니다. 3-Clause BSD License에 따라 출시 된 무료 소프트웨어입니다.

pandas import 하기

import pandas as pd
import numpy as np

위 코드를 통하여 import 한다

Dataset 불러오기

read_csv

  1. url을 통하여 데이터셋 불러오기
df = pd.read_csv('www.example.com/drive/ex.csv')
  1. 로컬 파일로 부터 데이터셋 불러오기(colab)
    이번 실습부터는 google colab을 통하여 진행하기 때문에
    아래와 같은 명령어를 입력한 후 파일을 업로드
from google.colab import files

uploaded = files.upload()

df = pd.read_csv('/content/ex.csv')


위와 같은 항목에서 파일을 업로드하면 colab Notebooks 내 /content/ 폴더에 지정된다

3.google drive를 mount하여 데이터셋 불러오기
아래 코드를 실행하여 구글 드라이브를 활성화

from google.colab import drive
drive.mount('/content/drive')


위 창에서 URL을 클릭하면

드라이브 사용 계정을 클릭

해당 코드를
구글 드라이브 안에 불러올 파일을 넣은 후

df = pd.read_csv('/content/drive/MyDrive/ex.csv'
profile
학습기록

0개의 댓글