profile
NLP Researcher
post-thumbnail

[Udemy(유데미)] <실전 AI 서비스 기획> 수강 후기 - Session 2 (2/3)

이번 후기에서는 두번째 세션, 즉 이 강의의 메인 세션의 내용을 정리합니다. 풍부한 예시와 디테일한 설명 중에서 내용을 간추리려니 결코 쉽지 않은데요, 이번 세션은 그만큼 빼놓을 것이 하나도 없는, 정말 실전에서 바로 쓸 수 있는 내용으로만 꽉 채운 세션입니다. 개인적

2024년 3월 15일
·
0개의 댓글
·
post-thumbnail

LangCon2024 후기

이번 LangCon 의 주제는 '생성 모델 튜닝(LLM)' 으로,학계 및 업계의 다양한 시각과 시도에 대해 전해 들을 수 있었던 시간이었습니다.(개인적으로 Langcon2020 에서 발표한 후, 첫 랭콘 참석이었습니다 😊)LangCon2024 안내 페이지발표자 및 발

2024년 3월 3일
·
2개의 댓글
·
post-thumbnail

[Udemy(유데미)] <실전 AI 서비스 기획> 수강 후기 - Session 1 (1/3)

Udemy 에 아주 좋은 강의가 있어서 소개합니다.진짜 실전 AI 서비스를 기획할 때, 개발할 때 모두 필요한 내용만을 쏙쏙 추려서이해하기 쉽게 시각화된 강의자료 속에 다양한 예시와 함께 담아냈습니다.&lt;실전 AI 서비스 기획> 강의는 Upstage AI 의 이활석

2024년 2월 18일
·
0개의 댓글
·

[회고] 재입사 수습 회고

Timeline 우선 저는 10월 초 입사자이고, 이 글을 쓰는 지금은 2월 1일이니 약 4개월차에 접어들고 있군요 😉 2023.10 음성인식 입문 입사하기 전까지 저는 음성인식에 대한 지식과 경험이 전무했습니다. 막연히 인간의 언어를 다루는 도메인이니 제가 해 왔

2024년 2월 3일
·
0개의 댓글
·
post-thumbnail

Whisper : Transformer base STT Model

STT(Speech-To-Text) 의 대표적인 모델 중 하나인 Whisper 에 대해음성인식 회사의 현직자 관점에서 소개하고 설명합니다.https&#x3A;//arxiv.org/pdf/2212.04356.pdfWhisper 모델 구조와 학습 데이터 구축을 다룬 논문입

2024년 1월 21일
·
0개의 댓글
·

Speaker Diarization 오픈소스 프레임워크 소개

Speaker Diarization (화자 분할) 두 사람 이상이 대화를 하는 경우 각 화자를 구분하는 기술로, '화자가 다르다는 것을 인식'하기 위한 기술입니다. 이번 포스팅에서는 오픈소스 화자분할 프레임워크 3가지를 소개합니다. Pyannote https://

2024년 1월 6일
·
0개의 댓글
·

Speaker Recognition & Diarization

Speaker Recognition (화자 인식) 입력받은 음성 데이터를 미리 저장된 데이터베이스와 비교하여 화자가 누구인지 식별하는 기술 Speaker Identification (화자 식별) 등록된 여러개의 목소리를 비교하여 화자 식별 Speaker Veri

2023년 12월 19일
·
0개의 댓글
·
post-thumbnail

[Paper] In defence of metric learning for speaker recognition

https://github.com/clovaai/voxceleb_trainer (Review (그림으로 수식 설명)) [화자인식] Metric Learning in Speaker Recognition Abstract an extensive evaluation

2023년 12월 9일
·
0개의 댓글
·
post-thumbnail

[NLP] Transformer (5) : Decoder

이번 포스팅에서는 아래 도서 및 포스팅을 많이 참고했습니다. Do it! BERT와 GPT로 배우는 자연어 처리 https://www.yes24.com/Product/Goods/105294979 https://jalammar.github.io/illustrated-t

2023년 9월 18일
·
0개의 댓글
·
post-thumbnail

[NLP] Transformer (4) : Encoder etc

Self-Attention 을 제외한 Encoder 의 나머지 구성 요소를 살펴봅시다 본 포스팅은 다음 저서와 사이트를 참고하여 작성하였습니다. Do it! BERT와 GPT로 배우는 자연어 처리 https://www.yes24.com/Product/Goods/10

2023년 9월 18일
·
0개의 댓글
·

[NLP] Transformer (3) : Self-Attention & Multi-Head Attention

본 포스팅은 다음 사이트를 참고하여 작성하였습니다. https://ratsgo.github.io/nlpbook/docs/language_model/transformers/ Self-Attention? Attention 먼저 설명하겠습니다. Attention 은 '(문

2023년 9월 18일
·
0개의 댓글
·

[NLP] Transformer (2) : Overview & Encoder Input Embedding

이제 Transformer 를 살펴봅시다. 아래는 Transformer 구조를 그림으로 나타낸 것으로, NLP러라면 한번쯤 본 적이 있을 거에요. (저는 이 그림을 참고하여 Transformer 의 동작 원리를 설명하는 기술 면접을 치른 적이 있어요 😂) 이 포스팅

2023년 9월 18일
·
0개의 댓글
·

[NLP] Transformer (1) : Background (RNN, Seq2Seq)

올해 내내 백엔드 개발에 치중하여 NLP 지식을 많이 까먹었어요 😂 또한 기계번역 이외의 도메인에 뛰어들었더니 당장 내가 할 수 있는 게 없었고 특히 올 한 해 동안 ChatGPT, LlaMa 와 같은 LLM 이 쏟아져 나오면서 NLP러로서의 미래에 대해 많은 고민을

2023년 9월 18일
·
0개의 댓글
·
post-thumbnail

[배포] 8. NginX & Gunicorn

팀 프로젝트에서 저는 백엔드 및 AI 개발을 맡았고,FastAPI 와 python 을 이용해 백엔드 서버 개발을 마쳤습니다.이제 클라우드 담당 팀원으로부터 전달받은 서버 인스턴스에 개발한 백엔드 코드를 배포하여프론트엔드 담당 팀원이 API를 이용할 수 있게 해야 합니다

2023년 9월 11일
·
0개의 댓글
·
post-thumbnail

[모코숲] 재취업 수습기간 회고

재취업 후 2개월의 수습기간이 끝났습니다.2개월 동안 2차례의 평가를 거쳤는데 성과가 부족하여 수습기간 종료 후 정직원 계약까지 이어지지는 못했습니다.수습기간 중에 작성한 회고에서 언급했듯누구나 자신의 허물을 마주하는 일은 부끄럽고 꽤 용기가 필요한 일이지요.하지만 회

2023년 7월 28일
·
2개의 댓글
·

[NMT] 7. CTranslate

번역 모델 서빙 프레임워크로 당초 TorchServe 를 이용할 계획이었는데요,OpenNMT 에서 제공하는 CTranslate 를 먼저 이용하여 간단히 서빙해 보겠습니다.CTranslate2 is a C++ and Python library for efficient i

2023년 7월 18일
·
1개의 댓글
·
post-thumbnail

[FastAPI] 6. Database & CRUD

CRUD 우리는 우선 번역 언어 및 문장 쌍을 DB에 저장합니다. 데이터로 SQLAlchemy 모델 인스턴스를 만듭니다. add해당 인스턴스는 데이터베이스 세션에 개체입니다. commit데이터베이스에 대한 변경 사항(저장되도록). refresh인스턴스(생성된 ID

2023년 7월 17일
·
0개의 댓글
·
post-thumbnail

[회고] 글또 8기 회고

올해 2월부터 7월까지 약 반년 가까이 글또와 함께 했는데요,마지막 글 주제로 원래는 재취업 수습기간 회고를 적으려고 했지만글또 경험과 추억이 저에게는 매우 소중하고 특별하기 때문에글또 마지막 글 주제로 사랑하는 저의 글또 활동 회고를 작성합니다.글또의 존재는 이미 페

2023년 7월 16일
·
2개의 댓글
·

[FastAPI] 5. Database & SQLAlchemy & Pydantic

번역 서비스의 백엔드에서는 문장을 번역하는 일 이외에 번역 결과를 저장하는 DB 작업도 수행합니다.사용자가 입력한 문장과 번역 결과 등을 DB에 저장해 두었다가 추후에 모델 추가 학습 또는 품질 개선에 이용할 수 있거든요.이번 토이 프로젝트에서는 CRUD 작업 중 Cr

2023년 7월 14일
·
0개의 댓글
·
post-thumbnail

[FastAPI] 4. Route - Query Parameters

어제에 이어 라우트에 대해 마저 다뤄 보겠습니다.프론트로부터 parameter 를 이용해 정보를 전달받을 수 있는데요,공식 튜토리얼에서는 Path parameter 와 Query parameter 크게 가지로 나눠서 소개합니다.Path parameter 먼저 빠르게 설

2023년 7월 13일
·
0개의 댓글
·