DATA ANALYSIS PYTHON CLASS#2

codataffee·2024년 4월 26일
0

PYTHON CLASS

목록 보기
2/16
post-thumbnail

#데이터 분석 파이썬 종합반 2강


#파이썬의 뼈대 : 리스트, 튜플, 딕셔너리


#숲 그리기

  • 리스트, 튜플, 딕셔너리를 배워야 하는 이유
    • 데이터 분석을 할 때 다양하고 많은 데이터들을 다루어야 하는데,
      이런 데이터들을 구조화하고 조작하기 위해 필요하기 때문
    • 문법을 정확하게 알고 있어야 데이터를 적절하게 다룰 수 있고,
      문법들을 잘 알고 있을수록 훨씬 효율적인 프로그래밍을 할 수 있다.
  • 데이터를 담고, 정리하고, 꺼낼 때 필요하다!

#리스트

  1. 리스트(List)란?
    • 리스트는 파이썬에서 가장 자주 사용되는 데이터 구조 중 하나
      여러 항목들을 담을 수 있는 변경 가능한(mutable) 시퀀스(sequence)
  • 리스트의 기본 구조
    • 리스트는 여러 값을 순서대로 담을 수 있다.
      각 값은 쉼표로 구분되며, 대괄호 [ ] 안에 들어간다.
  1. 리스트의 기본 사용법

    • 리스트의 인덱싱(Indexing)
      리스트에서 특정 값에 접근하거나 일부분을 추출하는 방법?

      • 인덱싱: 리스트에서 특정 위치의 값에 접근하는 방법
    • 리스트의 다양한 메서드(Methods)

      • append( ): 리스트에 항목 추가
      • extend(): 리스트에 다른 리스트의 모든 항목을 추가
      • insert(): 리스트의 특정 위치에 항목을 삽입
      • remove(): 리스트에서 특정 값을 삭제
      • pop(): 리스트에서 특정 위치의 값을 제거하고 반환
      • index(): 리스트에서 특정 값의 인덱스를 반환
      • count(): 리스트에서 특정 값의 개수 반환
      • sort(): 리스트의 항목들을 정렬
      • reverse(): 리스트의 항목들을 역순으로 반환
        +) 반환이라는 표현은 '결과 값을 얻어냈다' 정도로 이해
        +) index: 요소를 삽입할 위치(파이썬은 0부터 시작)
        +) element: 삽입할 요소의 값
    • 리스트 값 삭제

      • 리스트에서 특정 값을 삭제하거나 전체를 삭제하는 방법
    • 리스트 값 변경

      • 인덱싱을 활용해 특정 위치의 리스트 값을 다른 값으로 변경할 수 있다.
    • 중첩된 리스트에서 인덱싱하기

      • 두 개 이상의 중첩된 리스트에서도 인덱싱이 가능
    • 리스트가 실전에서 사용되는 예) : 간단한 데이터 계산


#리스트 고급 사용법

  1. 슬라이싱

    • 리스트 슬라이싱은 리스트의 일부분을 추출하는 것
      리스트에서 특정 범위의 항목을 선택하거나 리스트를 자르는 등의 작업 가능

      파이썬은 맨 처음을 가리키는 인덱스가 0 (1이 아님에 주의하자!)
      슬라이싱을 할 때 끝에 입력할 인덱스는 내가 선택할 인덱스보다 +1 해줘야 함!

      • 슬라이싱을 활용해 홀수나 짝수 값만 추출하는 것도 가능
  2. 정렬

    • sort( ) 메서드는 리스트의 항목들을 정렬하는 데 사용
      리스트 내의 항목들이 오름차순으로 정렬됨
      기본적으로 숫자와 문자열에 대해서는 오름차순으로 정렬되며,
      리스트의 항목들이 동일한 형태일 경우에만 정렬 가능.
    • sort( ) 메서드는 원래의 리스트를 변경하며, 새로운 정렬 리스트를 반환하지는 않음.
      +) reverse : 정렬 순서를 지정, 기본값은 False(오름차순), True로 설정하면 내림차순.
  3. 리스트가 실전에서 사용되는 예) : 데이터를 임의의 범위만큼 선택할 때 슬라이싱, 인덱싱 사용

    • 실제 Iris 공용 데이터셋을 활용해 데이터 중의 일부를 train dataset, 나머지를 test dataset으로 구분하는 작업
      +) AI 모델을 학습할 때 Train dataset으로 학습하고 Test dataset으로 평가를 진행
      이 두 데이터가 절대로 섞이면 안되고 따로 구분을 해야 함!


#튜플

  1. 튜플이란?

    • 튜플은 변경할 수 없는(immutable) 시퀀스(sequence) 자료형
      리스트와 유사하지만 한 번 생성된 이후에는 요소를 추가, 삭제, 수정 불가
    • 파이썬에서 데이터를 보호하고 싶을 때 주로 사용
      튜플은 소괄호 ( ) 를 사용하여 생성하며, 각 요소는 쉼표로 구분
  2. 튜플 인덱싱, 슬라이싱

    • 튜플은 변경할 수 없기 때문에 요소 추가 삭제, 수정이 불가능함
      하지만 튜플을 합치거나 반복해 새로운 튜플을 생성할 수 있음
    • 이러한 특징은 데이터 불변성을 보장하고, 데이터 분석에서 데이터의 무결성을 유지하는 데 도움
  3. 튜플에서 자주 사용하는 메서드

    • count ( ): 지정된 요소의 개수 반환
    • index ( ): 지정된 요소의 인덱스 반환
  4. 튜플과 리스트의 차이점

    • 튜플 = 변경 불가 (튜플을 합치거나 반복해 새로운 튜플 생성은 가능!)
      리스트 = 변경 가능
  5. 튜플 > 리스트 / 리스트 > 튜플 변경

    • 튜플을 리스트로 변경하려면 list( ) 함수를 사용하고,
      리스트를 튜플로 변경하려면 tuple( ) 함수를 사용
    • 각 함수는 인자로 변환하려는 자료형을 전달받아 새로운 자료형으로 변환.
  6. 튜플이 실전에서 사용되는 예) : 변하면 안되는 개인정보 데이터 튜플에 담기


#딕셔너리

  1. 딕셔너리란?

    • 파이썬 딕셔너리는 키-값 쌍의 데이터를 저장하는 자료 구조
      중괄호 { } 로 둘러싸여 있으며 각 요소는 쉼표로 구분
    • 각 키는 유일해야 하지만 값은 중복될 수 있음
      해시 테이블로 구현되어 있어 키를 사용하여 매우 빠르게 값을 찾기 가능
  2. 딕셔너리 기본기

    • 파이썬 딕셔너리는 다양한 용도로 사용 가능
  3. 딕셔너리에서 자주 사용되는 메서드

    • keys(): 모든 키를 dict_keys 객체로 반환
    • values(): 모든 값을 dict_values 객체로 반환
    • items(): 모든 키-값 쌍을 (키, 값) 튜플로 구성된 dict_items 객체로 반환
    • get(): 지정된 키에 대한 값을 반환합니다. 키가 존재하지 않으면 기본값을 반환
    • pop(): 지정된 키와 해당 값을 딕셔너리에서 제거하고 값을 반환
    • popitem(): 딕셔너리에서 마지막 키-값 쌍을 제거하고 반환
  4. 딕셔너리가 실전에서 사용되는 예) : 데이터를 사전처럼 저장하고 싶을 때

    • 사용자 정보 관리
    • 제품 카탈로그
    • 날짜별 이벤트 관리

#QUIZ

  • 리스트 활용 퀴즈

  • 튜플 활용 퀴즈

  • 딕셔너리 활용 퀴즈


profile
커피 좋아하는 데이터 꿈나무

0개의 댓글

관련 채용 정보