book segmentation 방법론 정리

우수민·2021년 3월 17일
0
post-thumbnail

책장 이미지 분석을 하기 위해 조사하였던 3가지 방법론


1. skimage 라이브러리 활용

  • 장점 : 오픈 소스라 사용하기 쉬움.
  • 단점 : 일반적으로 얇은 책이나 책에 직전이 있을때 구분이 잘되지 않음. 실제 책의 수와 결과의 수가 차이가 심함. 파라미터를 일반화 시키기 어려움.
  • 정리 : 책이 아닌 바둑판이나 간단한 경우에는 활용하기 좋지만, 책의 경우엔 오차가 심하여 사용이 불가능함.

관련 링크 :
1. 실제 테스트 및 정리 : https://velog.io/@suminwooo/skimage-%EB%9D%BC%EC%9D%B4%EB%B8%8C%EB%9F%AC%EB%A6%AC-%ED%99%9C%EC%9A%A9
2. skimage 정리 링크 : https://jessicastringham.net/2018/12/01/books/

2. 꼭지점 검출 논문 -> 실제 구현 X

  • 장점 : 수학적으로 꼭지점을 계산하기에 알고리즘을 그대로 구현한다면 큰 성능을 발휘함.
  • 단점 : 실제 서비스에 적용하기 위해 논문을 구현하기 위한 시간을 많이 투자해야함.(공개된 소스가 존재하지 않음.)
  • 결론 : 이미지쪽을 공부하면서 연구하는 것은 좋지만, 서비스를 넣기엔 한계가 존재한다.


논문 : Viewpoint-Independent Book Spine Segmentation

3. CNN 활용

  • 장점 : 책이 어떤 방향으로 존재하더라도 인식 결과가 좋음.
  • 단점 : 책장 이미지 수집 및 라벨링에 많은 시간이 필요하다. 또한, GPU로 학습하는데 시간이 오래걸린다.
  • 정리 : 시도해본 세가지 방법중 가장 좋은 정확도가 나오며 구현을 해두면 모델(Yolo or mask rcnn)을 자주 업데이트 시키지 않아도 좋은 성능을 보여줌.


관련 링크
1. 실제 테스트 및 정리 : https://velog.io/@suminwooo/CNN-%ED%99%9C%EC%9A%A9
2. mask rcnn github 링크 : https://github.com/akTwelve/Mask_RCNN


profile
데이터 분석하고 있습니다

0개의 댓글