딥러닝 - 언어지능 Part1

songmin jeon·2024년 4월 8일
0


  • Part3에서는 프로젝트 관련하여 배울 예정이다.

AI 관련 홈페이지



실습 1

허깅페이스 사전학습모델사용하기

필요한 모델 복사 > 입력하여 다운받고 사용하기


  1. 텍스트 마이닝, 자연어처리 -> 토큰화 / 수치화
  • 예시) 나는 / 오늘 / 밥을 / 먹었다.
    • 유니그램 : 나는/오늘/밥을/먹었다.
    • 바이그램 : 나는오늘/오늘밥을/밥을먹었다.
    • 트라이그램 : 나는오늘밥을/오늘밥을먹었다.

  1. 빈도 기반 vs 임베딩 방식
  • 빈도 기반
    • 단어를 구분만
    • 부피가 커진다.
  • 임베딩 방식
    - 컬럼이 추가됨(친밀도, 크기, 등등)
    • 빈도 기반보다 더 디테일 있다.



실습2

워드 임베딩 실습


profile
제가 한 번 해보겠습니다.

0개의 댓글