DATA ANALYSIS PYTHON CLASS#1

codataffee·2024년 4월 25일
0

PYTHON CLASS

목록 보기
1/16
post-thumbnail

#데이터 분석 파이썬 종합반 1강


#파이썬 소개 및 입문


#숲 그리기

  • 파이썬의 가장 기본적인 문법 배우기
    1. 파이썬이 뭘까?

      귀도 반 로섬이 개발한 프로그래밍 언어. 간결하고 가독성이 높은 것이 특징.

      파이썬은 다른 프로그래밍 언어에 비해 진입장벽이 낮고, 직관적이며, 코드 실행결과를
      수시로 확인해볼 수 있기 때문에 초보자들이 입문하기에 좋은 언어라고 한다.

    2. 다양한 패키지(분석, 시각화, 머신러닝, 딥러닝 등)를 사용할 수 있기 때문에
      데이터 분석에 있어서 매우 중요한 언어!


#Colab 주요 단축키(windows 기준)

  1. 코드 실행: 코드 셀을 실행하려면 Shift + Enter
  2. 새 코드 셀 추가: 코드 셀을 추가하려면 코드 셀 위에서 Ctrl + M + A
  3. 코드 셀 삭제: 코드 셀을 삭제하려면 코드 셀 위에서 Ctrl + M + D
  4. 코드 셀 분할: 코드 셀을 분할하려면 코드 셀 위에서 Ctrl + M + - (하이픈)
  5. 셀 유형 변경: 코드 셀을 마크다운 셀로 변경하려면 Ctrl + M + M

#출력문

  • 파이썬의 가장 기본, 출력문

    파이썬의 출력문은 코드상의 어떤 결과물들을 출력시켜서 확인할 수 있도록 해주는 문법
    코드 작성 시 수시로 확인하기 위해,
    수정할 오류를 점검하기 위해,
    데이터 시각화를 위해 등등...
    다양한 경우에서 사용되기 때문에 가장 많이 쓰는 문법!

  • print( ) < 괄호 안에 출력하고자 하는 값을 넣어주면 됨.
    여러 값을 출력할 때는 콤마(,)로 구분.

  • 실전 사용 예시 1) : 데이터 분석 결과물 출력

  • 실전 사용 예시 2) : AI 모델의 정확도 출력


#변수

  • 파이썬의 핵심, 변수는 무언가를 담을 수 있는 바구니 같은 존재

    변수 선언.

    • 변수는 값을 저장하는 공간으로, 사용하기 전에 선언해야 한다.
    • 변수를 선언할 때에는 변수명을 지정하고, 할당 연산자(=)를 사용해 값을 할당한다.

    변수 사용.

    • 변수에는 어떠한 값이든 할당할 수 있으며, 변수명을 사용해 해당 값에 접근 가능.
      변수는 값을 다양한 연산에 사용할 수 있다.

    변수 자료형.

    • 파이썬은 동적 타이핑 언어로, 변수에 할당되는 값에 따라 자료형이 자동으로 결정.
      주요 자료형 :
      정수(int), 실수(float), 문자열(str), 리스트(list), 튜플(tuple), 딕셔너리(dict) 등
    • 특히, Sequence Type은 '순서대로 나열된 자료형'으로 문자, 리스트, 튜플 등이 해당.

    type 함수를 이용해 해당 변수가 어떤 자료형인지 알아보기.

  • 변수의 종류1 : 문자열

    • 문자열은 작은 따옴표('')나 큰 따옴표("")로 감싸서 선언.

    • 문자열 연산.

    • 문자열과 함께 메서드 사용.
      메서드는 함수를 사용하는 방법 중 하나.

  • 변수의 종류2 : 숫자열

    • 정수(int)나 실수(float) 형태의 숫자열은 그냥 변수에 할당.
    • 숫자열 연산.
      숫자열 변수끼리 사칙연산 가능.
    • 숫자열 함수와 메서드 사용.
      숫자열에는 다양한 함수와 메서드가 내장.
    • 정수형과 실수형의 차이점.
      • 정수형(Integer)
        소수점 이하의 부분이 없는 숫자로 연산 결과도 항상 정수로 나옴.
      • 실수형(Float)
        소수점 이하의 숫자를 포함하는 숫자로 연산 결과도 소수점 이하를 포함한 실수로 나옴.
  • 변수의 종류3 : 불리언(Boolean)

    • 불리언 자료형이 주어진 조건이 참(True) 또는 거짓(False)를 나타내는 데 사용.
      조건식을 평가하는 데 매우 중요하며 데이터 분석에도 자주 활용.
  • NaN (결측값)

    • NaN(Not a Number)은 데이터에서 결측치(missing value)를 나타내는 특수한 값.
      주로 수치형 데이터에서 발생,
      특히 데이터 과학이나 머신 러닝 분야에서 데이터 정제 및 처리 과정에서 자주 다룸.
    • NaN은 정의할 수 없는 수치값을 나타냄.
      예를 들어, 0으로 나누는 연산이나 유효하지 않은 수학적 연산 결과를 나타낼 때 사용.
    • 데이터프레임과 같은 데이터 구조에서는 결측치를 표현할 때 NaN이 사용.
      • 수학 연산에서 발생하는 NaN (에러가 뜬다.)
      • 데이터프레임에서의 NaN
  • 입력문 (input)

    • input( ) 함수는 사용자로부터 키보드로 입력을 받는 함수.
    • 사용자가 입력한 값은 문자열 형태로 입력됨.
      숫자를 입력받아 연산을 수행하고 싶을 땐 int( ) 함수를 사용해 정수로 변환하는 과정 필요.
      • 변수 실전 예시 1) : 데이터를 담고자 할 때
      • 변수 실전 예시 2) : 계산된 값을 담고자 할 때
      • 변수 실전 예시 3) : 머신러닝 모델구조 자체를 담고자 할 때

#QUIZ

  • 숫자 자료형 값을 변수에 저장하고 출력하기

  • 문자 자료형 값을 변수에 저장하고 출력하기

profile
커피 좋아하는 데이터 꿈나무

0개의 댓글

관련 채용 정보