이 글에서는 데이터 엔지니어링에서 실시간 데이터를 관리할 때 사용하는 Topic에 대한 관리 방법에 대해서 정리한다.
자연어 처리에 사용되는 아주 간단한 개념에 대해서 정리한다.자연어 처리 중 가장 기본적인 개념은 시퀀스를 만들어내는 작업이다. 보통 고정된 길이의 연속된 토큰(Token) 시퀀스를 N-그램(N-gram)이라고 한다.유니그램 : 토큰 1개로 이루어진 연속된 시퀀스바이그램