day 043 KPMG Future Academy

sottuggung·2025년 2월 21일
0

KPMG-future-academy

목록 보기
40/41

KPMG Future Academy AI 활용 데이터 분석가 3기 43일차 수업을 2025년 1월 17일에 참석했다.

  1. 미니프로젝트

  2. 머신러닝

  3. 미니프로젝트
    발표 진행후 project 페이지 스크래핑 코드를 유지보수하기 좋은 프로그래밍 방식으로 다시 작성하였다. 약 4시간 소요. 각 동작에 대해 함수로 다시 작성하여 반복 가능하도록 정제하였다.

이후 Amount 데이터(투자금액)에 대해

  1. 머신러닝
    Scaling :

    데이터 분리 :

Train 학습용 약 50%
Validation 검증용 약 30%
Testing 평가용 약 20%

sklearn 사이킷런 설치 후 버전 확인

x, y 분리

모듈 불러와서 학습열 지정
random_state로 값 고정 (수치가 아님)

모델링

예측 결과 비교

NaN, None 차이
NaN (Not a Number) : float 유형의 특별한 값. 숫자 데이터에서의 결측치. 파이썬의 math 모듈이나 Numpy에서 사용.
None : 파이썬에서 객체가 없음을 뜻함. NonType 객체. 문자열, 날짜와 같은 비숫자형 결측치를 나타낼 때 주로 사용.

profile
hello world

0개의 댓글