기초부터 쌓아가는 머신러닝_2(from. 거친코딩 youtube)

OH햅삐·2021년 4월 3일

머신러닝_기초

목록 보기

2/2

1.Series 실습

pd.Series([1,2,3], index=['가','나','다'])
가    1
나    2
다    3
dtype: int64

＊인덱스를 사용하는 이유

데이터 정렬

조회

Series와 array 차이는 인덱스 차이

Series: 인덱스 o

array: 인덱스 x

DataFrame에서 특정 컬럼을 선택함
ex)
series = df[column name]
0    John
1    Jenny
2    Nate
3    Julia
4    Brian
5    Chris
Name: name, dtype: object
#pd.Series의 옵션이 무엇이 있는지 확인

index : 할당값의 지정 이름, 중복 가능

dtype: 대표적 : int, float, string, boolean등

ex) # series = pd.Series([1,2,3,4], index=['a','b','c','d'],dtype='float)

a  1.0
b  2.0
c  3.0
d  4.0
dtype: float 64 (float 형식)

series.sort_values(ascending= True) #오름차순 설정(내림차순의 경우 ascending=False)

b  2.0
d  4.0
c  5.0
d  10.0
dtype: float 64

시각화 할때 sort_values 많이 쓰임

DataFrame 실습

df = pd.DataFrame({'a':[2,3], 'b':[5,10]})

   a  b
0  2  5
1  3  10



df = pd.DataFrame([[2,5],[3,10],[10,20]],columns=['a','b'])
df
	a	b
0	2	5
1	3	10
2	10	20

## columns를 통해서 columns 이름 지정 가능
## index를 통해서 index 이름 지정 가능
## dtype를 통해서 data type 지정 가능

3탄에서 계속

OH햅삐

#주니어 개발자

이전 포스트

기초부터 쌓아가는 머신러닝_2(from. 거친코딩 youtube)

머신러닝_기초

1.Series 실습

＊인덱스를 사용하는 이유

#pd.Series의 옵션이 무엇이 있는지 확인

시각화 할때 sort_values 많이 쓰임

3탄에서 계속

기초_머신러닝#1(from.거친코딩 youtube)

0개의 댓글