[udemy] python 부트캠프_section25_pandas & csv

Dreamer ·2022년 9월 12일
0
post-thumbnail

01. pandas

  • 데이터 분석을 효과적으로 도와주는 라이브러리
  • pandas 라이브러리를 사용하지 않는다면 아래와 같이 복잡한 방식으로 데이터를 불러와야 한다.
with open("weather_data.csv") as data_file:
    data = data_file.readlines() #list 형태로 반환
    print(data)

#csv file을 ','를 기준으로 리스트 형식으로 저장
import csv
with open("weather_data.csv") as data_file:
    data = csv.reader(data_file) #data 객체는 반복이 가능함.
    temperature = []
    for row in data:
        if row[1] != "temp":
            temperature.append(int(row[1]))
    print(temperature)
import pandas as pd
data = pd.read_csv("weather_data.csv")
temperature = data["temp"]
  • 데이터 프레임을 list, dictionary 등 다양한 형태로 변환할 수 있다.
import pandas as pd

data = pd.read_csv("weather_data.csv")

# convert to dictionary
data_dict = data.to_dict()
print(data_dict)

# convert to list
temp_list = data["temp"].to_list()

02. 평균 구하는 3가지 방법

import pandas as pd
import numpy as np

data = pd.read_csv("weather_data.csv")
temp_list = data["temp"].to_list()

#calculate mean
avg_temp = np.mean(temp_list)
print(avg_temp)

avg_temp_2 = sum(temp_list) / len(temp_list)
print(avg_temp_2)

avg_temp_3 = data["temp"].mean()
print(avg_temp_3)
# find max temperature
max_temp = data["temp"].max()
print(max_temp)

print(data.condition)
print(data["condition"])

# get data in Row
print(data[data.day == "Monday"])
print(data[data.temp == data.temp.max()])

monday = data[data.day == "Monday"]
monday_temp = int(monday.temp)
monday_temp_F = monday_temp * 9/5 + 32
print(monday_temp_F)

# Create a dataframe from scratch
data_dict = {
    "students": ["Amy", "James", "Angela"],
    "scores": [76, 56, 65]
}
data = pd.DataFrame(data_dict)
print(data)

# Convert to CSV files
data.to_csv("new_data.csv")
profile
To be a changer who can overturn world

0개의 댓글