안정적이고 간결한 학습 코드를 제공하는 torchmetrics 라이브러리 소개
CLIP과 Support Vector Machine을 활용한 image classification 모델
Torch Dataset을 구축할 때, 각 샘플을 Dict형과 List형으로 저장할 때의 시간 비교
부끄럽고 자괴감이 많이 들었지만 부족했던 부분과 면접 자리에서 대답이 아쉬웠던 질문들을 기억해두기 위한 기록.내가 AI/ML 엔지니어로서 가질 수 있는 강점?AI/ML 모델 기본기. 단지 도메인 specific한 공부만 한 게 아니라 모델의 학습 원리와 과정에 대해서도
DFS 문제이면서 cycle 개념과 수학적인 비용 계산이 포함된 좋은 문제
DFS, DP, itertools를 모두 활용해 볼 수 있는 좋은 문제
백준 1148 단어 만들기 word1의 알파벳들로 word2를 만들 수 있을까? Counter를 만들어서 두 단어 비교해보기
W2V의 Skipgram 방식으로 상품군별 쇼핑리뷰 corpus를 학습시키고, aspect seed와 유사한 단어들을 추출해내는 과정
aspect seed에서 aspect words를 뽑아내기 위해 W2V skipgram을 사용한다. 여기서는 W2V 방식에 대한 설명
nonlocal 변수와 recursion을 사용해보기 (DFS 등을 풀 때 매우 유용)
Stack을 활용해서 사각형의 면적과 관련된 문제를 푼다. 코드로만 보면 이해가 힘들 것 같아서 그림으로 메모해둔다.
Khaiii로 토크나이즈하고 TF-IDF와 유사한 형태의 함수를 커스터마이징 하여 리뷰 속 주요 단어(aspect seed)를 뽑아내는 작업을 해보았다.
한국어 리뷰로 Aspect Extraction을 위한 데이터셋을 구축하는 과정 - 전처리
Khaiii를 활용해 리뷰 Aspect Extraction 데이터셋을 직접 구축하기 위한 계획
리뷰 데이터에서 aspect를 추출하는 task에 어떤 한국어 토크나이저가 적합할지 비교해보았다.
이 글은 지난 6월 진행했던 초미세먼지 예측 모델(서울시 초미세먼지 예측 모델링 포스팅)을 실제 사용 가능한 프로그램으로 다듬어서 배포한 과정을 담고 있다.