기초부터 쌓아가는 머신러닝_2(from. 거친코딩 youtube)

OH햅삐·2021년 4월 3일
0

머신러닝_기초

목록 보기
2/2

1.Series 실습

pd.Series([1,2,3], index=['가','나','다'])

가    1
나    2
다    3
dtype: int64

*인덱스를 사용하는 이유

  1. 데이터 정렬
  2. 조회

Series와 array 차이는 인덱스 차이

  • Series: 인덱스 o
  • array: 인덱스 x

DataFrame에서 특정 컬럼을 선택함
ex)

series = df[column name]
0    John
1    Jenny
2    Nate
3    Julia
4    Brian
5    Chris
Name: name, dtype: object

#pd.Series의 옵션이 무엇이 있는지 확인

  1. index : 할당값의 지정 이름, 중복 가능
  2. dtype: 대표적 : int, float, string, boolean등

ex) # series = pd.Series([1,2,3,4], index=['a','b','c','d'],dtype='float)

a  1.0
b  2.0
c  3.0
d  4.0
dtype: float 64 (float 형식)

series.sort_values(ascending= True) #오름차순 설정(내림차순의 경우 ascending=False)

b  2.0
d  4.0
c  5.0
d  10.0
dtype: float 64

시각화 할때 sort_values 많이 쓰임

DataFrame 실습

df = pd.DataFrame({'a':[2,3], 'b':[5,10]})

   a  b
0  2  5
1  3  10



df = pd.DataFrame([[2,5],[3,10],[10,20]],columns=['a','b'])
df
	a	b
0	2	5
1	3	10
2	10	20

## columns를 통해서 columns 이름 지정 가능
## index를 통해서 index 이름 지정 가능
## dtype를 통해서 data type 지정 가능

3탄에서 계속

profile
#주니어 개발자

0개의 댓글