220616 AIPM과정 D067

대구 AI 스쿨 시작한지 67일차

💻 Study Progress

AI 프로그래밍
출처: 윤상혁 교수님 특강

1. 프로그래밍 실습 환경 구성

프로그래밍이란?

프로그래밍의 사전적 의미: 주어진 명령을 컴퓨터가 이해할 수 있는 언어로 입력
컴퓨터와의 대화
컴퓨터는 언어 0과 1로 이루어진 “이진” 코드 언어만 이해
Programming language: 영어 기반의 프로그램 언어
코드를 작성하면 프로그램 언어가 컴퓨터 이진 코드 언어로 바꿔서 전달

파이썬이란?

1991년 귀도 반 로선이 발표한 프로그래밍 언어
무료/쉽다
데이터 분석에 적합한 다양한 라이브러리(기능)를 제공
세계적으로 사용자 규모가 가장 큼

2. 판다스 series와 dataframe

전처리 과정을 알기 위해서는 판다스라는 라이브러리를 알고 활용 할 수 있어야 함

판다스란?

데이터 분석을 위한 패키지
데이터 라이브러리
데이터 핸들링을 편하게 해주는 라이브러리
파이썬을 이용해서 데이터 분석을 하는 경우 대부분이 판다스를 사용

판다스 불러오기

import 함수 사용

import pandas

shift+enter or 실행버튼 클릭
Pandas를 매번 불러오기 힘들기 때문에 별칭으로 불러오기
🔻별칭(Allias)은 반드시 pd로 사용합니다.

import pandas as pd

판다스 별칭이 잘 되었는지 확인

pd

Series와 Dataframe

Series

1차원 데이터
1차원: 1개의 column
이 때 Series의 S는 무조건 대문자
[]는 리스트

pd.Series([1, 2, 3, 4])

예제 60, 70, 80을 Series로 입력하기

pd.Series([60,70,80])

a라는 변수 안에 리스트 1, 2, 3, 4를 넣어서 변수를 가지고 시리즈 데이터를 얻기

a=[1,2,3,4]

a라는 변수 실행하기

a

판다스의 형태로 변수 시리즈 불러오기

pd.Series(a)

문자 데이터도 삽입가능/문자는 “”안에 삽입
mylist "가", "나", "다", "라" 입력하기

mylist=["가", "나", "다", "라"]

mylist pandas로 불러오기

pd.Series(mylist)

이때 datatype인 dtype: object라고 나타남

Dataframe

Dataframe 이란
2차원 이상의 데이터
여러개의 컬럼, 변수
방법1. 리스트로 만드는 방법
리스트 이름 =[[리스트1], [리스트2], [리스트3]]
대괄호 안에 대괄호
리스트 하나가 끝나면 항상 쉼표

score = [['홍길동', 70, 80],
         ['김영희', 90, 60],
         ['윤상혁', 70, 50]]

3. 판다스 예제파일 불러오기

4. 판다스 통계값 (describe 요약 info) 정렬

5. 판다스 Selection

6. 판다스 기술 통계

출처: 윤상혁 교수님 특강

profile
laaaaaaaaziest workaholic

0개의 댓글