시리즈

Data Handling

1.0. 데이터 핸들링 for AI

AI에 대한 관심과 활용도가 요즘 특히 챗GPT를 기점으로 급격하게 증가하고 있다. AI에 처음 공부하는 사람들은 알고리즘이나 최신 SOTA 기술 등의 모델 자체에 현혹(?)될 가능성이 높다. (내가 그랬다.) 하지만 막상 현업에서 다루는 데이터를 가지고 AI 모델을

2024년 4월 15일

2.1. 가상환경 생성 및 환경 설정

Python 프로젝트를 진행할 때 가장 자주 마주치는 골칫거리 중 하나가 바로 패키지 관리인데, 여러 프로젝트를 한 가상환경에서 돌리다 보면 패키지 업데이트가 다른 프로젝트에 영향을 미치기도 한다. 패키지 버전 충돌 같은 문제가 발생하면, 정말 머리가 아프다.그래서 각

2024년 4월 15일

3.2. 데이터 불러오기

데이터 분석의 첫 단계는 효율적으로 데이터를 불러오는 것이다다. 본 글에서는 다양한 소스 또는 환경에서 데이터를 불러오는 다양한 방법을 정리하고자 한다. Excel 데이터를 불러올 때, index_col=0을 설정하면 데이터 프레임에서 불필요한 unnamed colum

2024년 4월 15일

4.3. 데이터 저장하기

다양한 형태의 데이터 저장 방법을 살펴보고자 한다. 데이터 저장을 위한 폴더가 이미 존재하는지 확인하고, 없다면 새로 생성Excel, csv index=False는 데이터를 저장할 때 인덱스를 제외하도록 설정하는 부분이다. data에 한글이 있을 경우 csv파일로 저장

2024년 4월 15일