1. 데이터 수집하기
네이버 영화의 댓글을 모아 구성된 한국어 텍스트 감성 분석
뉴스 기사 데이터(news_summary_more.csv)
2. 데이터 전처리하기 (추상적 요약)
전혀 가공되지 않은 nsmc 데이터셋 텍스트 파일을 읽어 data_loader 생성
3. 어텐션 메커니즘 사용하기 (추상적 요약)
4. 실제 결과와 요약문 비교하기 (추상적 요약)
5. Summa을 이용해서 추출적 요약해보기
추상적 요약 : 문법적 오류가 많고 내용의 퀄리티가 좋지 않아 보임.
추출적 요약 : 기사를 그대로 추출해서 요약하는 것이기 때문에 상대적으로 완성도는 높았으나, 핵심내용이 아닌 경우가 많았고 text의 앞문단과 뒷문단을 무지성으로 긁어 요약이라고 보여준 느낌이 큼.
뉴스 요약에는 기사의 전체적인 내용을 함축하고 있는 추출적 요약이 더 적합하다.