졸업 프로젝트 0. 개요

hong030·2021년 11월 21일
0

졸업 프로젝트

목록 보기
1/4

1. 주제

: 자연어처리와 크롤링 기반 강의 계획서 자동 정리 및 일정 관리 어플리케이션

강의 계획서를 하나하나 읽고 수기로 일정을 정리하는 것은 굉장히 불편한 일이다. 이에 대해, '학생이 원하는 강의를 선택하면 해당 강의의 계획서 내용이 자동으로 스캔되어 일정이 정리되어 스케줄러에 표시되는 어플리케이션' 을 개발하고자 한다.

2. 구현할 내용

  1. 원하는 페이지에 접속해 필요한 파일을 다운로드하는 크롤링 및 스크래핑 코드.
  2. 파일 내용을 해석하는 자연어 처리 코드
  3. 파일 내용을 저장할 DB
  4. 핵심 기술을 넣을 서버
  5. 스케줄러 어플리케이션

* 세부 사항:

1-1. robots.txt 파일을 확인하고 크롤링을 진행한다.
2-1. 한글과 영어가 섞여있고, 표가 많은 강의 계획서 특징에 따라 ocr을 사용하여 텍스트를 추출한다.
2-2. ocr은 구글 vision api를 사용한다.
3-1. 강의 계획서 파일을 저장할 DB로 mysql을 두고 어플리케이션에 개개인의 일정을 저장할 sqlite을 둔다.
4-1. 서버는 파이썬으로 구현한다.
5-1. 어플리케이션은 자바 (안드로이드 스튜디오)로 구현한다.
5-2. 서버와 어플리케이션을 잇기 위해 api 통신을 사용한다.

profile
자바 주력, 프론트 공부 중인 초보 개발자. / https://github.com/hongjaewonP

0개의 댓글