[회고] 재입사 수습 회고

Judy·2024년 2월 3일
0

[글또] etc

목록 보기
6/6

월별 회고

우선 저는 10월 초 입사자이고,
이 글을 쓰는 지금은 2월 1일이니 약 4개월차에 접어들고 있군요 😉
수습기간 동안의 기억을 되짚어 봅니다.

2023.10

음성인식 입문

입사하기 전까지 저는 음성인식에 대한 지식과 경험이 전무했습니다.
막연히 인간의 언어를 다루는 도메인이니 제가 해 왔던 자연어처리와 비슷할 것이라 생각했는데
음성인식 모델의 대부분은 ResNet 을 쌓아올려 만든 모델이 대부분이고
화자 분할 태스크에서는 머신러닝 분류기 (ML Classifier) 도 이용하다 보니
저는 학부 인공지능 수업을 청강할 때 사용한 교재를 오랜만에 꺼내 읽어야 했습니다.

논문 리뷰

우선 온보딩 과정에서 논문 리뷰 시간을 갖고 음성인식의 기초와 주요 음성인식 태스크에 대한 개념을 잡아 나가기 시작했습니다.

과제 할당 : 화자인식, 화자분할

입사 후 첫 과제로 '화자분할 모델을 실제 서비스에 붙이기' 가 주어졌습니다.
논문 실험 재현을 위해 깃헙 레포지토리를 참고하여 모델에 데이터를 추가로 학습시켰고
실시간으로 입력되는 음성에 대해 화자 분할을 적용하고 백엔드에 붙일 방법을 찾기 위해
오픈소스 프레임워크의 코드를 리뷰하고 성능을 끌어올릴 방법을 찾았습니다.
(Classifier 개선, 실시간 음성 처리 로직 리뷰)

2023.11

과제 지속 : 화자 분할

한 달 가까이 화자 분할에 대해 이해한 내용을 정리하여 사내 기술세미나에서 발표했습니다.
실제 서비스로 이어질 경우를 대비해 미리 스트레스 테스트도 수행했습니다.
(나중에 알았는데, 스트레스 테스트는 서비스 개발 단계의 맨 마지막에 진행합니다.)

2023.12

업무 할당 : C++ 개발

이번에는 음성인식 엔진은 dll 에 구현하고, UI 까지 개발하는 업무를 맡았습니다.
dll 개발은 처음이고, 필드에서 C++ 을 사용하는 건 처음이었는데
악성코드 분석가로 일할 당시 (저의 전 직업이에요) dll 을 수없이 리버스 엔지니어링해 보았기 때문에 대략적인 원리(구조) 를 알고 있었고,
문제는 C++ 을 이용해 UI 구현하는 것이었습니다.... 😂
QT Framework 를 쓸까, MFC를 쓸까 이런저런 시도도 해 보았다가
결국 ChatGPT 를 붙들고 C++ 로 작성했습니다.
이 작업이 꼬박 일주일 걸렸네요...

돌아보며...

처음 접하는 음성인식 분야에 대해 조금 알게 되었고,
이 때 알게 된 것들, 논문 리뷰부터 프레임워크 비교, 개념정리 등등을 문서로 만들어 둔 덕분에
글또에 한번 더 정리해서 제출하고 복습할 수 있었습니다 (글또 최고!!)

다음 글은 다시 공부 및 연구 글로 돌아올 수 있기를...!

profile
NLP Researcher

0개의 댓글