이번 후기에서는 두번째 세션, 즉 이 강의의 메인 세션의 내용을 정리합니다. 풍부한 예시와 디테일한 설명 중에서 내용을 간추리려니 결코 쉽지 않은데요, 이번 세션은 그만큼 빼놓을 것이 하나도 없는, 정말 실전에서 바로 쓸 수 있는 내용으로만 꽉 채운 세션입니다. 개인적
이번 LangCon 의 주제는 '생성 모델 튜닝(LLM)' 으로,학계 및 업계의 다양한 시각과 시도에 대해 전해 들을 수 있었던 시간이었습니다.(개인적으로 Langcon2020 에서 발표한 후, 첫 랭콘 참석이었습니다 😊)LangCon2024 안내 페이지발표자 및 발
Udemy 에 아주 좋은 강의가 있어서 소개합니다.진짜 실전 AI 서비스를 기획할 때, 개발할 때 모두 필요한 내용만을 쏙쏙 추려서이해하기 쉽게 시각화된 강의자료 속에 다양한 예시와 함께 담아냈습니다.<실전 AI 서비스 기획> 강의는 Upstage AI 의 이활석
Timeline 우선 저는 10월 초 입사자이고, 이 글을 쓰는 지금은 2월 1일이니 약 4개월차에 접어들고 있군요 😉 2023.10 음성인식 입문 입사하기 전까지 저는 음성인식에 대한 지식과 경험이 전무했습니다. 막연히 인간의 언어를 다루는 도메인이니 제가 해 왔
STT(Speech-To-Text) 의 대표적인 모델 중 하나인 Whisper 에 대해음성인식 회사의 현직자 관점에서 소개하고 설명합니다.https://arxiv.org/pdf/2212.04356.pdfWhisper 모델 구조와 학습 데이터 구축을 다룬 논문입
Speaker Diarization (화자 분할) 두 사람 이상이 대화를 하는 경우 각 화자를 구분하는 기술로, '화자가 다르다는 것을 인식'하기 위한 기술입니다. 이번 포스팅에서는 오픈소스 화자분할 프레임워크 3가지를 소개합니다. Pyannote https://
Speaker Recognition (화자 인식) 입력받은 음성 데이터를 미리 저장된 데이터베이스와 비교하여 화자가 누구인지 식별하는 기술 Speaker Identification (화자 식별) 등록된 여러개의 목소리를 비교하여 화자 식별 Speaker Veri
https://github.com/clovaai/voxceleb_trainer (Review (그림으로 수식 설명)) [화자인식] Metric Learning in Speaker Recognition Abstract an extensive evaluation
이번 포스팅에서는 아래 도서 및 포스팅을 많이 참고했습니다. Do it! BERT와 GPT로 배우는 자연어 처리 https://www.yes24.com/Product/Goods/105294979 https://jalammar.github.io/illustrated-t
Self-Attention 을 제외한 Encoder 의 나머지 구성 요소를 살펴봅시다 본 포스팅은 다음 저서와 사이트를 참고하여 작성하였습니다. Do it! BERT와 GPT로 배우는 자연어 처리 https://www.yes24.com/Product/Goods/10
본 포스팅은 다음 사이트를 참고하여 작성하였습니다. https://ratsgo.github.io/nlpbook/docs/language_model/transformers/ Self-Attention? Attention 먼저 설명하겠습니다. Attention 은 '(문
이제 Transformer 를 살펴봅시다. 아래는 Transformer 구조를 그림으로 나타낸 것으로, NLP러라면 한번쯤 본 적이 있을 거에요. (저는 이 그림을 참고하여 Transformer 의 동작 원리를 설명하는 기술 면접을 치른 적이 있어요 😂) 이 포스팅
올해 내내 백엔드 개발에 치중하여 NLP 지식을 많이 까먹었어요 😂 또한 기계번역 이외의 도메인에 뛰어들었더니 당장 내가 할 수 있는 게 없었고 특히 올 한 해 동안 ChatGPT, LlaMa 와 같은 LLM 이 쏟아져 나오면서 NLP러로서의 미래에 대해 많은 고민을
팀 프로젝트에서 저는 백엔드 및 AI 개발을 맡았고,FastAPI 와 python 을 이용해 백엔드 서버 개발을 마쳤습니다.이제 클라우드 담당 팀원으로부터 전달받은 서버 인스턴스에 개발한 백엔드 코드를 배포하여프론트엔드 담당 팀원이 API를 이용할 수 있게 해야 합니다
재취업 후 2개월의 수습기간이 끝났습니다.2개월 동안 2차례의 평가를 거쳤는데 성과가 부족하여 수습기간 종료 후 정직원 계약까지 이어지지는 못했습니다.수습기간 중에 작성한 회고에서 언급했듯누구나 자신의 허물을 마주하는 일은 부끄럽고 꽤 용기가 필요한 일이지요.하지만 회
번역 모델 서빙 프레임워크로 당초 TorchServe 를 이용할 계획이었는데요,OpenNMT 에서 제공하는 CTranslate 를 먼저 이용하여 간단히 서빙해 보겠습니다.CTranslate2 is a C++ and Python library for efficient i
CRUD 우리는 우선 번역 언어 및 문장 쌍을 DB에 저장합니다. 데이터로 SQLAlchemy 모델 인스턴스를 만듭니다. add해당 인스턴스는 데이터베이스 세션에 개체입니다. commit데이터베이스에 대한 변경 사항(저장되도록). refresh인스턴스(생성된 ID
올해 2월부터 7월까지 약 반년 가까이 글또와 함께 했는데요,마지막 글 주제로 원래는 재취업 수습기간 회고를 적으려고 했지만글또 경험과 추억이 저에게는 매우 소중하고 특별하기 때문에글또 마지막 글 주제로 사랑하는 저의 글또 활동 회고를 작성합니다.글또의 존재는 이미 페
번역 서비스의 백엔드에서는 문장을 번역하는 일 이외에 번역 결과를 저장하는 DB 작업도 수행합니다.사용자가 입력한 문장과 번역 결과 등을 DB에 저장해 두었다가 추후에 모델 추가 학습 또는 품질 개선에 이용할 수 있거든요.이번 토이 프로젝트에서는 CRUD 작업 중 Cr
어제에 이어 라우트에 대해 마저 다뤄 보겠습니다.프론트로부터 parameter 를 이용해 정보를 전달받을 수 있는데요,공식 튜토리얼에서는 Path parameter 와 Query parameter 크게 가지로 나눠서 소개합니다.Path parameter 먼저 빠르게 설