Basic-Pandas 5회차 [42회차]

차현빈·2025년 12월 16일

스파르타코딩클럽

들어가기

배울 내용
문제정의 - 데이터 확인 - 데이터전처리 - AI모델 선정 - 학습 데이터 분할 - 학습 - 성능평가
강의 자료를 따라가보면서 전체적인 흐름 파악이 목적

1. 문제정의

건강에 좋지 않은 수치인 LDL콜레스테롤 수치를 예측하는 모델을 개발

2. 데이터 확인

건강검진 데이터 파일을 불러와서 df로 만듬

칼럼들만 보면 다음과 같다

Index(['기준년도', '가입자일련번호', '시도코드', '성별코드', '연령대코드(5세단위)', '신장(5cm단위)',
'체중(5kg단위)', '허리둘레', '시력(좌)', '시력(우)', '청력(좌)', '청력(우)', '수축기혈압', '이완기혈압', '식전혈당(공복혈당)', '총콜레스테롤', '트리글리세라이드', 'HDL콜레스테롤', 'LDL콜레스테롤', '혈색소', '요단백', '혈청크레아티닌', '혈청지오티(AST)', '혈청지피티(ALT)', '감마지티피', '흡연상태', '음주여부', '구강검진수검여부', '치아우식증유무', '결손치 유무', '치아마모증유무', '제3대구치(사랑니) 이상','치석'], dtype='object')