Hbase란? 분산 NoSQL '데이터저장소'로 여러 가지의 NoSQL중 Column-Family model에 속한다. 구글의 BigTable을 기반으로 설계되었으며, HDFS위에서 동작한다. 비정형/반정형 대량 데이터에 대한 분석 처리 지원에 적합하며, 강력한 일관성
데이터 통합 검색데이터 리니지 시각화데이터셋 리니지(Dataset -> Dataset)SnowflakeBigQuerydbt파이프라인 리니지(DataJob -> Dataset)AirflowFile(yml)Nifi대시보드 리니지(Dashboard -> Chart)Looke
개요 사내에서 실시간 작업에 대한 요건이 증가함에 따라 스트림 데이터를 처리할 플랫폼을 구성할 필요가 생겼습니다. 플랫폼을 구성하기에 앞서 어떤 도구를 활용하는게 좋을지 PoC(Proof of Concept)를 진행하면서 배운 내용을 정리해봅니다. 스트림 프로세싱 >
Trie란 트라이는 실무에 매우 유용하게 쓰이는 트리 형태의 자료구조로서, 특히 자연어 처리(NLP)분야에서 문자열 탐색을 위한 자료구조로 널리 쓰입니다.트라이는 검색을 뜻하는 'retrieval'의 중간 음절에서 용어를 따왔습니다. 저는 알고리즘 문제를 풀 때 처음
시작하며 처음 팀에 왔을 때 데이터베이스 동기화 모니터링 솔루션을 개발하는 프로젝트의 웹 어플리케이션 개발에 참여하게 되었습니다. 저희가 사용할 라이브러리는 React로 이미 결정이 되어 있었고, 추가적으로 Mobx라는 상태관리 라이브러리를 사용하기로 했습니다. 이 전
2020년 4월 1일, 입사하여 처음 담당하게된 프로젝트의 웹 어플리케이션 개발을 맡게 되었습니다.당시에 개발 중이던 웹 어플리케이션은 사내의 UI 프레임워크를 사용하여 개발 중이었습니다. 그런데 이 프레임워크에 몇가지 문제점(윈도우에서만 빌드 가능, 하위호환성을 지원