servicesdatascience-notebook이라는 service 정의hostname: 네트워크에서 컴퓨터나 장치를 식별하는 namerestart: always- 컨테이너가 어떤 이유로든 중지되면 자동으로 다시 시작volumesdocker container 내에서

Data Collection데이터는 다양한 소스에서 수집 가능 - 데이터베이스, 웹 스크래핑, 외부 API, 로그 파일 등Data Processing 수집된 데이터는 분석하기 적당한 표 형태로 가공Data Cleansing Outlier 또는 N/A값에 대한 처리 포함
3. Airflow 프로젝트 생성 및 DAG 개발 ML 파이프라인은 하나의 워크플로우로 이루어지며, 데이터 추출, 데이터 유효성 검사, 데이터 전처리, 모델 학습, 모델 평가 및 검증 그리고 예측과 같은 단계를 작업(Task)으로 구현하고 실행할 수 있음 3.1 Apache Airflow Airflow는 데이터 파이프라인을 구축, 스케일링 관리하는 오...

4.1 MLOps란? 4.1.1 MLOps 정의 MLOps는 Machine Learning Model의 개발과 운영을 효율적으로 관리하기 위한 방법론이다. 모델 개발 -> 테스트 -> 배포 -> 모니터링 데이터 과학자와 엔지니어 간 협업을 강화하고, 모델 개발 및 운영