졸업작품에 필요한 데이터셋 json파일을 일부 수정해서 jsonl 파일로 바꾸는 작업을 해봤다.
처음에는 '엄청 큰 데이터니까 pandas로 해야겠지?' 라는 생각에
json -> pandas -> json -> jsonl로 변환하려고 했다.
근데 하다보니 어차피 복잡한 작업을 수행할것도 아닌데 굳이 pandas를 왜 거치지? 라는 생각이 들었다.
결국 인코딩문제로 몇시간을 고민하던 코드를 싹 지우고 그냥 json -> jsonl로 변환했다.
트라이 자료구조를 대강 정리해서 포스팅했다. 필요하다면 나중에 내용을 첨삭할 예정이다.