집계함수


x= np.arange(8).reshape((2,4))

np.sum(x, axis=0)
# array(p4,6,8,10])

np.sum(x, axis=1)
# array([6,22])

집계함수: 데이터에 대한 수학적 요약통계를 확인

마스킹연산

x= np.arange(5)
# array([ 0,1,2,3,4])

x<3
# array([True, True, True, False, False])

x>5
# array([False, False, False, False, False])

x[x<3] 
# array([0,1,2])

마스킹 연산: 특정값을 기준으로 boolean 형태로 반환

퀴즈

x= np.arange(20).reshape((2,10))
print(np.max(x))

연산결과 =>
19

해설 => np.arange(20) 은 0~ 19까지의 숫자이고, reshape((2,10)) 을 통해 행2 열10인 형태로 변환되는데, 집계함수 max( ) 를 이용하여 가장 큰 숫자를 반환해야 하므로 19 를 출력한다.

  • 8일차 후기
    오늘은 처음보는 마스킹연산에 대해서 배웠다.
    그냥 True False로만 반환하는 불리안 형식은 알았는데,
    이름이 마스킹 연산인지는 몰랐다.
    argmax() 등의 함수와 함께 내가 불리언인덱싱이라고 알고 있던 사용법을 많이 사용했는데 이제는 제대로 마스킹연산이라고 불러야겠다.
    x[x<3] 등의 마스킹연산 사용을 통해서 True 에 해당하는 값만 도출할 수 있다.
profile
데이터분석

0개의 댓글