개요 처음 4개의 장에서는 데이터 시스템이 단일 장비든 분산 시스템이든 상관없이 보편적으로 적용되는 기본 개념을 다룬다. 그 중 이번 첫 번째 장에서는 데이터 시스템이 가져야 하는 가장 중요한 요소들 중 신뢰성(Reliability), 확장성(Scalability),
AWS ECS Capacity Provider(용량 공급자) 를 통해 서버 인프라를 비용 효율적이면서도 쉽게 관리할 수 있는 방법을 배워보자! 개요 회사에서는 도커 이미지 기반의 AWS ECS 를 많이 사용하고 있다. 최근 오토스케일링과 관련하여 발생한 몇몇 성능
소프트웨어 개발에서 테스트는 반드시 필요하다.하지만 매번 개발할 때마다 테스트를 수동으로 하게 되면 그에 드는 시간과 노력 비용이 상당히 크다.또한 사람이 직접 하는 것이다 보니 테스트해야 할 부분을 놓치거나 틀린 부분을 발견하지 못하는 등의 실수가 나올 수 있다.따라
지난 포스팅에서 데이터 엔지니어란 무엇이며, 어떤 역량이 필요한지 알아보았다.이번에는 데이터 엔지니어의 로드맵을 알아보려고 한다.즉, 완성형 데이터 엔지니어가 되기까지 무엇을 어떤 순서로 공부해야 하는지, 구체적인 기술 스택을 통해 알아볼 것이다.자료는 2021년 버전
한 줄로 정의하자면 데이터를 전문으로 담당하는 소프트웨어 엔지니어 라고 볼 수 있다.구체적으로 나눠보면 산업별, 회사별로 데이터 엔지니어가 하는 업무와 사용하는 기술이 다 다르지만 공통적으로 하는 역할은 같다.바로 사업에 필요한 데이터를 잘 분석할 수 있도록 데이터 시
계획과 목표를 세우기 전에 먼저 나를 먼저 점검해볼 필요가 있다.나의 현 상황을 이야기해보자.2020년 1월 처음 입사하여 산업기능요원으로 지금까지 같은 회사에서 근무하고 있다. 데이터 팀에 소속되어 있으며 주로 데이터 처리, 추출과 관련된 여러 프로젝트들을 맡았다.주