우선 CNN에 대해서 먼저 알아보도록 하자.일반적인 cnn의 기본적인 구조는 아래와 같다.Convolution Layer와 Sub-Sampling Layer들이 일정 수 만큼 나온 후 마지막에 Fully-Connected Layer가 나오는 구조이다.cnn은 이미지에

여러 성능 개선 방법을 모색하던 중에, 삼성 SDS에서 진행한 컨퍼런스에서 발표한 자료를 찾게 되었다. Roberta-large 모델에 cnn레이어를 추가하여 지역적 특징을 반영하면 성능이 올라갈 수 있다는 것이다. CNN은 컴퓨터 비전 분야를 위해 개발되었으며, 대중

QA MRC 모델 성능향상을 위해 각종 retrieval 모델을 구현해보며 알게된 점들을 정리하려고 한다.Term Frequency (TF): 특정 단어가 문서 내에서 얼마나 자주 나타나는지를 측정한다. 이 값이 높을수록 해당 단어가 문서에서 중요하다고 간주된다.Inv