[data science]pandas

덴장·2026년 4월 16일

data

목록 보기
10/55

csv 파일에 헤더가 없는 경우 아래와 같이 지정해 준다.

df = pd.read_csv('data/burger.csv', header=None, names=["product_name", "calories", "carb", "protein", "fat", "sodium", "category"])

인덱스명도 아래와 같이 지정이 가능하다.

df = pd.read_csv("data/burger.csv", index_col="product_name")

df = pd.read_csv("data/burger.csv", index_col=0) 위와 같은 의미

name,matches,minutes,goals,assists
Pierre Højbjerg,38,3420,2,4
Hugo Lloris,38,3420,0,0
Son Heung-Min,37,3114,17,10
Harry Kane,35,3082,23,14
Eric Dier,28,2520,0,0
Tanguy Ndombele,33,2091,3,2
Sergio Reguilón,27,2244,0,3
Toby Alderweireld,25,2240,1,0
Serge Aurier,19,1605,2,3
Davinson Sánchez,18,1486,0,0
Moussa Sissoko,25,1585,0,0
Lucas Moura,30,1411,3,4
Ben Davies,20,1346,0,1
Matt Doherty,17,1240,0,2
Steven Bergwijn,21,1208,1,3
Giovani Lo Celso,18,945,1,1
Gareth Bale,20,920,11,2
Harry Winks,15,861,0,0
Joe Rodon,12,733,0,0
Dele Alli,15,620,0,1
Japhet Tanganga,6,487,0,0
Érik Lamela,23,717,1,0
Carlos Vinícius,9,308,1,0
Dane Scarlett,1,1,0,0

players_df.describe()

* 골을 가장 많이 넣은 선수의 골 수

max_goals = players_df['goals'].max()
print("최다 득점:", max_goals)

* 가장 적은 시간 뛴 선수의 경기 시간(분)

min_minutes = players_df['minutes'].min()
print("최소 출전 시간:", min_minutes)
profile
개발자

0개의 댓글