데이터포털에서 데이터를 지능적으로 검색하기 위한 질의 처리 기술을 개발한다. 다양한 지식(knowledge)가 저장되어 있는 온톨로지로부터 사용자가 원하는 지식들을 효과적으로 검색하고 처리하는 기술을 개발한다.ㅇㅇㄱ 교수님 지도아래나 이외 2명의 팀원과 함께 진행함.W
Data Catalog Vocabulary (version 2) Definition DCAT은 웹에 공개된 data catalog들 사이의 교류를 용이하기 위해 만들어진 RDF vocabulary이다. 즉. data catalog를 적는 표준이다. what is
Definition인공지능에 의해 제공되는 지능형 검색은 정보를 빠르고 쉽게 찾고자 하는 고객을 돕고, data silos를 줄이는 방법이다.사용자는 어디서든 형태에 상관없이 정보(데이터베이스의 빅데이터, 파일 시스템, 디지털 콘텐츠, web page, etc...)를
처음 소개된 것이 2013년 8월 경으로 알려져있는 허밍버드는 랭킹과 관련한 구글의 코어 알고리즘의 업데이트로서 검색자가 사용한 쿼리 의도를 더욱 정교하게 이해하고 이 의도에 관련성이 더 높은 콘텐츠를 매칭 시키기 위해 만들어졌다. 이렇게 출현한 허밍버
문서를 RDF를 변환해야하는 주제에 대해 연구를 해야해서논문들을 찾아보다가'웹 문서를 자동으로 RDF로 변환하는 방법'이라는 논문을 발견해 한 번 나온대로 구현해 보았다stanford pos tagger (형태소 분석기)https://nlp.stanford.e
https://github.com/philipperemy/Stanford-OpenIE-Pythonhttps://nlp.stanford.edu/software/openie.html파이썬 버전은 pip install이 자꾸 오류남java버전으로 진행밑에
Coreference resolutionit 과 같은 대명사처리를 위해 본문 텍스트를 전처리해줘 보았다.wiki Korea 본문의 처음 6문장을 가지고 테스트함.tokenize, ssplit, pos, lemma, ner, parse, coref꼭 순서대로 넣어줘야함