안녕하세요 글또 8기 여러분! AI 연구 채널의 최민주 입니다. 닉네임은 Judy 이고요 🙋🏻♀️ 글또를 시작한 첫날, 저는 이렇게 자기소개를 했어요. 이렇게 자기소개를 한 만큼 (?) 저는 글또 8기 첫 글 주제를 일찌감치 정했답니다. 제가 좋아하는 기계번역
안녕하세요! 글또 8기 AI 연구 채널의 최민주 입니다 🙋🏻♀️지난 포스팅에서 AI 시대의 기계번역에 대해 쭉 언급했는데요,실제로 NMT 즉 신경망 기반 기계번역 실험 또는 서비스를 위해 고려할 점, 구현해야 할 점에 대해 이번 포스팅을 시작으로 앞으로 차근차근
안녕하세요! 글또 8기 AI 연구 채널의 최민주 입니다 🙋🏻♀️ 지난 NMT 시리즈에서 NMT 학습용 데이터셋을 구축하기 위해 고려할 점에 대해 간단히 이야기하였습니다. 이번 글에서는 데이터셋을 정제하는 몇 가지 방법을 소개하겠습니다. 데이터셋을 정제하기 위해
Sentence Alignment 앞서 PCF 글에서는 이미 만들어진 번역 모델 학습용 데이터셋(Parallel Corpus) 를 필터링하는 방법들을 소개하였는데요, 이번 글에서는 Parallel Corpus 를 만들기 위해 문장을 정렬하는 방법을 소개하겠습니다.
앞서 시리즈에서 번역 모델 학습용 데이터셋을 구축하였는데요, 구축한 데이터셋을 이용해 번역 모델을 만들기 위해 대표적인 오픈소스 NMT 모델 프레임워크 2가지를 소개합니다. (2가지 프레임워크 모두 연구와 현업에서 활발하게 쓰입니다.) 각 프레임워크 사용방법은 튜토
안녕하세요! 기계번역 이야기하는 Judy 입니다 🙋🏻♀️ 아쉽게도 이번에 마지막으로 기계번역 이야기를 들려드리게 되었어요 🥲 당초 시리즈에서 목표로 한 각각의 주제에 대해 제가 아는 지식을 대부분 풀어냈고 결정적으로 본의 아니게(?) 이제는 업무상 기계번역 이외