개인 프로젝트 | KPP - 4

trevor1107·2021년 3월 11일
0

오늘의 성과

오늘은 몸살과 비염으로 컨디션이 많이 안좋아서 푹 쉬면서
오라클 클라우드 설정, FTP SSH로 접속, Node.js 서버 켜는 것을 시도해보고
크롤링을 통해 국내 주식 정보를 스크래핑에 도전했는데 charset이 EUC-KR로 되어있어서 한글 깨짐 문제가 발생하였다

axios로 요청할 때 옵션을 아래와 같이 설정

{
	encoding: null,
	responseType: 'arraybuffer',
}

그리고 헤더 정보에 나와있는 charset을 찾아서 utf-8이 아닌녀석들은 iconv모듈로 디코딩 해주어서 정보를 스크래핑 했다.
추가로 숫자 및 ','만 추출하는 정규표현식(/[^0-9,]/g)과
초성을 제외한 한글 추출 정규표현식(/[^가-힣]/g)으로 필요 정보들을 분류!

내일은 더 나은 컨디션을 위해 바이바이!👋

profile
프론트엔드 개발자

0개의 댓글