[개발일지-11]NumPy

PARK's Marketing & HTML·2022년 4월 12일

Ai 학습 개발일지

목록 보기
3/3

학습내용

오늘은 4월 12일이지만 7일 강의에 대한 일지를 적어보고자 한다.
왜 이제 적냐고 묻지 마라, 어려워서 복습을 게을리 했다는 대답은 절대 하지 못한다.
심지어 '나는 안걸릴줄 알았던' 오미크론에 걸려버리니.. 다들 전염병에 조심하시면 좋겠다고 생각했다.

NumPy

  • Data를 다루거나 Machine Learning을 활용하기 위해선 잘 만들어진 데이터의 구조가 필요하다.
  • NumPy는 가볍고 강력한 성능과 적절한 기능으로 Python으로 데이터를 다룰 때 필요한 배열을 제공한다.
  • NumPy의배열은 Python에서 제공하는 배열보다 빠르고 유연한 기능들을 제공한다.
  • NumPy는 차원의 개념을 잘 구현하고 있으며 1차원 데이터부터 n차원의 데이터까지 표현한다.
  • python을 사용하는 대부분의 환경에서 기본적으로 설치되어 있다. 그러나 설치되어 있지 않다면
    'pip install numpy'명령어를 입력해 설치가능, (Jupyter notebook에선 앞에 !를 붙여야함)
  • 데이터 사이언스 영역 대부분의 도구(pandas) NumPy기반

딱 하나있는 데이터, 방향성이 없다 ( 스칼라 )
여러개의 데이터, 1차원적 방향성이 생긴다(벡터)
벡터가 >가로방향 말고 ^위로 올라가면 여러개가 이어진 데이터가 위로 쌓인다(사각형모양). 방향성이 하나 더 생기는것이다. 이 데이터가 뒤로 가면 진짜 3차원적인 사각형 모양의 데이터 x,y,z축으로 표현 가능한 벡터가 나온다.

2^1 = 1/ 2^4 = 16 / 2^8 = 256
2의 8승은 비트가 8개라는 소리, 8비트 = 1바이트
하나의 바이트로 표현 할 수 있는것 = 256 (But 컴퓨터는 숫자를 0부터 세기 때문에 255까지의 숫자라고 표현 하는 것)




numpy 배열 슬라이싱 부분은 잘 읽어보아야한다.


redwinquality라는 강사님이 주신 csv파일을 받아 분석해보는 실습을 했다.



Pandas는 메모리상에 테이블이 있다. 그 안에서 우리가 필요한 형태 대로 데이터를 재단하거나, 만져볼 수 있다. Pandas는 Series나 DataFrame 두가지 차원이 있다.
각각의 column 하나 하나를 series객체라 부르고, 이것들이 모여 table을 형성하는데, 이것을 dataframe이라 부른다.(Dataframe은 R(언어)의 데이터프레임이 제공하는 모든것을 제공한다)


위는 winequality 실습부분.

어려웠던 점

pandas에서 제공하는기능, 각 함수가 무얼 나타내는지, 왜 코드는 이런 구조인지, 각 명령어는 어떤것을 의미하는지 모르겠다.

해결방법

복습뿐인것 같다 ㅎㅎ....

학습소감

훌륭한 강사님께 좋은 교육을 들으니 학구열이 불타다가도 길고 긴 수업시간에 지치고 만다. 수업이 끝나면 한숨 자고 밥먹고 공부 하는데...글쎄 생활 패턴을 바꿔야겠다. 아예 공부를 하고 쉰다던지 해야겠다.

profile
22.03~22.08 대구 Ai스쿨 프로덕트 마케터 과정 수강

0개의 댓글