KPMG Future Academy AI 활용 데이터 분석가 3기 43일차 수업을 2025년 1월 17일에 참석했다.
미니프로젝트
머신러닝
미니프로젝트
발표 진행후 project 페이지 스크래핑 코드를 유지보수하기 좋은 프로그래밍 방식으로 다시 작성하였다. 약 4시간 소요. 각 동작에 대해 함수로 다시 작성하여 반복 가능하도록 정제하였다.
이후 Amount 데이터(투자금액)에 대해
Train 학습용 약 50%
Validation 검증용 약 30%
Testing 평가용 약 20%
sklearn 사이킷런 설치 후 버전 확인
x, y 분리
모듈 불러와서 학습열 지정
random_state로 값 고정 (수치가 아님)
모델링
예측 결과 비교
NaN, None 차이
NaN (Not a Number) : float 유형의 특별한 값. 숫자 데이터에서의 결측치. 파이썬의 math 모듈이나 Numpy에서 사용.
None : 파이썬에서 객체가 없음을 뜻함. NonType 객체. 문자열, 날짜와 같은 비숫자형 결측치를 나타낼 때 주로 사용.