머신러닝 워크플로우에는 데이터 탐색, 데이터 처리, 모델 학습, 평가 및 튜닝이 있습니다. 각각의 작업은 지속적으로 수행되므로 기존의 방식은 Jupyter notebook을 반복해서 실행해야 한다는 문제가 있습니다.
Eylra는 JupyterLab 확장프로그램으로, 코딩 없이 파이프라인을 만들고 실행할 수 있는 노트북 파이프라인 시각적 편집기(Visual Editor)를 제공하는 라이브러리입니다.
Elyra는 IBM의 CODAIT(Center for Open Source Data & AI Technologies)에서 개발한 오픈소스 프로젝트입니다.
머신러닝은 데이터 수집 > 분석 > 처리 > 학습 > 배포 > 예측 및 유지 보수를 반복하는 워크플로우를 가집니다. 각각의 기능을 담당하는 코드를 모듈화하여 관리하고, 이를 시각적인 UI로 연결하여 파이프라인을 직관적으로 구성할 수 있습니다.
파이프라인은 JupyterLab에서 Kubeflow 또는 Apache Airflow를 이용해 로컬로 실행시킬 수 있습니다.