profile
배움은 즐겁다.
post-thumbnail

[자연어처리] Static Word Embedding 후 결과 비교 분석하기

영화 감상이 취미인 나는 거의 매주 영화관에 가서 개봉하는 영화들을 챙겨봤었는데 영화를 많이 보다 보니 좋아하는 영화 감독이 생겼고 그들의 영화가 개봉하면 꼭 챙겨보고 있다. 좋아하는 감독들의 연출기법, 장르, 소재, 분위기 등은 각자 완전히 다른데, 문득 내가 왜 그

2022년 6월 21일
·
0개의 댓글
·

[자연어처리] 중복 검출을 위한 텍스트 유사도 측정

띄어쓰기가 되어 있지 않은 문자열을 비교하여 중복인지 여부를 판단하는 프로세스를 만들었다.주로 행정안전부 - 인허가 데이터에서 '중식 음식점' 카테고리에 있는 상호명을 가져와 비교하였다.데이터 분석 툴: postgreSQL(SQL), Jupyter Notebook (P

2022년 6월 19일
·
0개의 댓글
·

[SQL로 자연어처리] pg_trgm 모듈

SQL로 자연어처리하기 - pg_trgm 모듈로 tri-gram 간단하게 실행. 텍스트유사도 측정링크텍스트

2022년 6월 17일
·
0개의 댓글
·

PYTHON으로 데드링크(Dead Link) 찾기

빅데이터 전공으로 대학원에 입학한 지도 이제 1년이 다 되어가는데 그동안 내가 현업에서 쓰고 있는 코드들을 포스팅해야지 맘만 먹고 바쁘다는 이유로 포스팅을 한 번도 하지 못했다. ​ 시작이 반이라고 최근에 사용한 코드를 올려보도록 하자. ​ 첫 번째로 포스팅할

2022년 6월 14일
·
0개의 댓글
·

[회귀분석 실습] Walmart Sales Forecast

기계학습 수업의 기말과제는 흥미로운 주제를 선택해서 기계학습 모델링을 해보는 것이다. 내가 실습하기에 흥미로운 주제를 찾다가 2014년 월마트에서 Kaggle Competition으로 제공한 월마트 데이터셋을 바탕으로 주간 매출액을 예측하는 회귀(Regression)분

2022년 6월 14일
·
0개의 댓글
·