220116

박찬웅·2022년 1월 16일
0

공부

목록 보기
3/12

빅데이터 실무 능력 1급
한국정보인재개발원

학교 특강으로 열린 과정에 등록해서 2일간 강의를 받고 시험에 응시했다.

강의 내용으로 R, Rstudio와 KoNLP 패키지를 사용해서 문자로 된 비정형데이터에 자연어처리 후 워드클라우드를 생성하는게 주 과제였다.

첫 날은 인공지능 발전의 역사와 간단한 이론적 지식들로 시작해서 작업환경 설치를 마쳤고, 두 번째 날부터 본격적으로 R 함수들과 패키지들을 사용해서 과제를 진행했다.
당일에 실습과제와 필기 시험을 실시했고, 필기 시험 난이도는 나눠주신 교재+기출.pdf 를 참고해서 공부하면 할 만 했다.
실습과제는 워드클라우드 + 빈도수 높은 단어.csv + 언급된 지명과 geodata를 매치시켜 지도에 시각화하기 정도였고 다행히도 참고할 코드를 제공받았다.

손기동 강사님이 열정적으로 학습자 한명 한명 질문을 받아주셔서 좋았다.

⬇︎과제로 제출한 제주도 관련 워드클라우드⬇︎

텍스트 처리는 다음과 같은 과정으로 진행되었다.

    1. 분석할 텍스트(크롤링 혹은 txt) 준비
    1. 목적에 맞게 의미를 갖는 단어추리기.
      (단어 나누기, 불용어 버리기)
      불용어란 의성어나 어미(-의, -는, -가, ㅋㅋ, 등등)를 뜻한다.
      정말, 제일 같은 필요없는 부사들도 제거해주었다.
      대부분 명사가 가장 많은 가치를 지녔다.
    1. table() 을통해 집계해서 빈도수에 비례하는 크기의 단어들로 워드클라우드 만들기

주말을 알차게 보낸 기념으로 파전🍶

profile
기록장

0개의 댓글