최근에 CI/CD 자동화 관련하여 데이터 파이프라인 구축 이슈가 제기되었는데, 이 과정에서 데이터 사일로라는 용어를 알게 되었다.
시스템 배포 측면에서 알아두면 유용하게 활용할 수 있을 개념일 것 같아서 정리해둔다.
조직 내에서 데이터가 독립적으로 관리되어 다른 부서 및 시스템이 접근하지 못하는 상태.
표면적으로는 이러한 의미이지만, 넓게 봐서 각 부서간 데이터 운용 방안이 다르고 표준 용어가 상이하며, 이에 따라 데이터 접근 뿐 만 아니라 데이터 활용까지 어려운 격리의 상태를 일컫는다.
향후에 설계를 한다면 이러한 사소한 부분까지 고려해야 할 것이다. 예를 들어, 시스템 운용 방안이 다르다면 데이터 사일로의 범주 내에 들 것이란 생각이 든다.
데이터 사일로 원인과 해결 방안 - https://blog.naver.com/quest_kor/223417306835
(*데이터 운용 테이블/DBMS도 다르면 데이터 사일로의 원인이 될 수 있음)