NLP, 허깅페이스 다뤄보기

*이 글은 어떤 지식을 공유하기 위함이라기 보다는 내가 공부한 것을 내가 더 잘 기억하기 위해 정리/메모 정도의 용도로 쓴 글입니다. Summary 오늘은 트랜스포머 모델, 딥러닝 모델 전체 개괄에 대한 개념을 정리하는 시간을 가졌다. Learn RNN Transf
개념이해만으로 어텐션 모델을 공부했었는데 실제로 텐서 차원들 단위로 이해하는데 시간이 좀 걸렸다.실습에서 bert의 인코더를 Pretrained model로 가져와서 실제 다른 task에 fine tuning 했는데 fine-tuning 개념에 대해서 좀 더 생각해보게
오늘은 사둔 책들이 좀 있어서, 그것들을 빠르게 다 읽고 토치는 그래도 앞으로 계속 사용할 거라서 기본적인 구조들을 정리하는 작업도 하려고 한다. 데이터 분석가가 알아야할 모든 것(40페이지 ~ 300페이지)EDA, 다중공산성공분산 행렬언더스탠딩 "한국산 인공지능 네이
Summay Learn Machine learning Yearning (한글 번역 링크) PCA, 요인 분석 Read/Watch Early days of AI https://blog.eladgil.com/p/early-days-of-ai?ut
Diary Learn 데이터 분석가가 반드시 알아야할 것 마무리 관련 개념 정리(SGD와 행렬분해, 피어슨 유사도와 추천시스템, 시계열 분석, ARIMA) 코드잇 머신러닝 3분 딥러닝 RNN 실습 Details 행렬분해와 SGD : 추천 시스템에서 우리는 결국 유저
Diary 오늘은 서류처리할 일이 많지 않아서 그렇게 공부를 많이하지는 못했지만 기본적으로, 트레이닝 데이터와 테스트 데이터에 대한 분산에 대해서 많이 생각해볼 수 있었다. 결국 우리의 목적은 궁극적으로 사용하려는 데이터의 성향을 반영한 모델을 만드는 것이기 때문에 항상 현재의 학습 데이터와 실제 데이터의 차이(분산적으로나, 데이터 수집적으로나)를 고민할 ...
Diary 생성형 AI로 가장 많은 비용 절감이 일어나는 곳이 게임, 컨텐츠라고 생각하고 앞으로도 가장 많이 사용될 곳이라고 생각하는 곳인데 NCSOFT에서 어떤 문제들을 고민하고 있는지 볼 수 있어서 좋다. 가끔씩은 단순 이론이나 이런 공부보다 실제 현업에서 어떻게 접근하고 있는지 이런 것들도 같이 보면 좋을 것 같다. Learn NCDP 2023 영상...
Diary 오늘은 텐서를 직접 다뤄보는 작업이랑, 논문을 직접 보면서 이해하는 작업을 좀 했다. 그동안은 책 속의 내용이나 블로그 중심으로 봤다면, 이제 좀 더 논문을 보고 실제 구현해보는 연습들을 조금씩 해보려고 한다. 이번 논문은 사실 코드랄게 없어서, 내용 이해와 개념 정리 정도만 했는데 다음부터는 좀 더 정리해보려고 한다. Learn Big Tra...

Diary 이제 공부하면서 조금씩 반복되는 개념들이 보이곤 하는데 그래도 아직은 뭔가 깊이가 부족한 느낌이 든다. 너무 다양한걸 공부하고 있나 싶기도 해서, 좀 하루에 공부하는 갯수를 좀 줄여봐도 좋을것 같다.하나만 진득하게 하는걸로. Learn JinCoding 실무형 NLP Course 6강: NLG (Natural Language Generation...