SOM-KPCA-SVM 모델로 생명 과학 산업에서 특허 품질(가치) 분류와 예측
특허 기관에 매년 상당한 양의 특허가 제출 되는데, 각 특허의 가치 평가와 진실 여부를 따지는 데에는 많은 비용이 소모 됨
해당 논문에서는 바이오 산업에서의 Patenet 가치를 Class를 나눠 분류하는 것을 목표로 함
고도화된 기술력 / 높은 투자 금액 / 긴 주기(임상) / 리스크 / High Income
WebPat, PatBase, Google Patent Search, Thomson Innovation 및 국가 특허청에서 Data 수집
특허 특징 추출 및 Quality Index 산출 (y)
Quality Index Min-Max Scale
Quality Index에 따른 Manually Classification이 있을 것이라 생각
Patent documnets에서 Key features Extract (KPCA)
Quality Classification 모델 학습 (SVM)
3.1.1 Quiality Index에 사용된 variable은 SVM 변수로 사용 X
New Patent는 Quality Indicator들이 명확하지 않으므로 Patent 자체의 특성만을 사용
SOM이 Group의 근거가 무엇인지?
이전에 다뤘던 논문들과 비슷한 Feature들을 사용하였음
SOM, K-PCA의 Input Data를 어떻게 넣고, SVM 시 Data를 어떻게 Concat 하였는지에 대한 서술이 없어서 아쉬움
과거 Patent의 가치를 다루기에는 쉽지만, 최근 Publish 된 Patent의 가치는 Patent 내부 요소들로 최대한 끌어내야한다는 문제