# Bidirectional LSTM

3개의 포스트
post-thumbnail

Named Entity Recognition with BiLSTM

이번에는 이전글의 두번째 버전으로 새로운 파일로 실습해보자. 이번글에서 실습으로 사용된 .csv 파일은 여기서 다운받을 수 있다. 코랩이나 주피터에서 사용할 경우 그 파일과 같은 디렉토리에 .csv파일이 위치할 수 있게 하자. 코랩이라면 이 파일을 업로드하면 된다. Packages 필요한 패키지들을 다운받아준 후, 방금 올린 .csv파일을 unzip해주자. Import Data 파일을 불러와 data안에 저장한다. Data Preprocessing 어떻게 생겼는지 확인해보자. ![](htt

2021년 9월 1일
·
0개의 댓글
·
post-thumbnail

Named Entity Recognition 개체명 인식

이번 글에서는 개체명 인식을 소개한다. 개체명 인식은 대표적인 시퀀스 레이블링 태스크에 속하는데, 시퀀스 레이블링이란 [x1, x2, x3, ... ,xn]에 대해서 [y1, y2, y3, ... ,yn]을 각각 부여하는 작업을 말한다. 아래 예제 파일을 미리 가져와보겠다. 각 단어에 대해 출력값이 있기 때문에 return_sequences = True를 꼭 설정해 주어야 한다. ![](https://images.velog.io/images/yelim421/post/44db0baa-0cd5-4676-b650-9f2b811c9371/

2021년 8월 31일
·
0개의 댓글
·
post-thumbnail

POS Tagging with Bidirectional LSTM

이번 글에서는 양방향 LSTM을 이용해 품사 태깅을 해 볼 것이다. 양방향을 쓰게되면 문장의 처음과 끝 문맥을 잘 반영할 수 있게 된다. 패키지를 다운받아주자. Packages NLTK에서는 토큰화와 품사 태깅이 완료된 데이터를 불러올 수 있다. Data Preprocessing 데이터를 tagged_sentences안에 저장하였다. 길이와 내용을 출력해서 전체 문장의 길이와 내용을 확인해보자. ![](https://images.velog.io/images/yelim421/post/99f311df-37

2021년 8월 31일
·
0개의 댓글
·