현재 진행중인 프로젝트는 북마크 서비스이다. 기존 북마크 서비스들이 og 태그를 기반으로 링크의 title, description, image를 긁어오는 것과는 달리 특정 카테고리에 맞추어 추가적인 속성을 크롤링해와서 사용자에게 보이고 있다.
어제 법률 자문에서 이렇게 크롤링하고 서버에 저장하는 것이 법적인 문제가 있을 수 있다는 이야기를 들었다. 세상의 불편함을 조금 해결해보려 한 건데 인생에 빨간줄이 그이면 안 되니까 최근 문제가 되었던 크롤링 사례들을 분석해보았다.
크롤링 관련 법적 분쟁 사례 중 가장 유명한 사례이다. 이 사건은 야놀자와 여기어때가 번갈아 가며 승소를 하였기 때문에 크롤링의 법적 처분에서 어떤 부분에 초점 맞추어야 할 지 알기 좋다.
여기어때가 야놀자의 숙박 업소 관련 정보를 수집하였고, 이 과정에서 약 1600만 건의 API를 호출하면서 야놀자 측에서 감지하게 되었다.
경쟁 업체
임을 주목하였다. 야놀자와 여기어때 모두 숙박 업소 서비스인만큼, 타 서비스의 데이터를 크롤링하여 자사 서비스에서 보이는 행위는 부정 경쟁
이라고 판단한 것이다.공개된 데이터
였다. 또한, 야놀자 측에서 해당 접근을 금지하는 별도의 처리를 하지 않았다. 따라서, 법원에서는 접근 권한이 없는 정보에 침입한 사례가 아니라고 판단한 것이다.전부 또는 상당 부분
에 대한 복제 및 배포라고 볼 수 없다는 판단 하에 여기어때 측의 승소에 힘을 실어주게 되었다.잡코리아와 사람인 간의 법적 분쟁은 사람인 측에서 잡코리아의 데이터를 수집하면서 2008년에 시작되었다. 결과적으로 사람인이 해당 분쟁에서 패소했다.
위 사례들에서 얻은 결론을 정리해보면
- 경쟁 업체의 데이터를 수집하였는가?
경쟁 업체의 데이터를 수집하여 자사 서비스의 데이터인것처럼 서비스하면 공정 경쟁에 어긋난다고 판단할 수 있다.- 해당 데이터가 공개된 데이터인가?
해당 데이터가 누구나 접근할 수 있는 공개된 데이터가 아니거나 접근을 막기 위해 별도의 처리가 되어 있는 데이터라면 정보 통신망에 침입했다고 볼 수 있다.- 데이터의 양과 질
수집한 데이터가 해당 DB의 전부 또는 상당 부분에 속하거나, 해당 서비스의 특별한 공수가 들어간 데이터라면 그 데이터의 경제적 가치를 인정할 수 있다.
로 정리할 수 있다. 하지만, 이 글만 보고 '해당 경우만 피하면 되겠지'라는 생각은 아주 위험하다. 크롤링이 법적 분쟁에 휘말리게 된 것은 시기적으로 얼마되지 않아 전문가들도 정확한 판단을 내릴 판례가 부족하기 때문이다. 또한, 적절한 수준의 크롤링이라는 것이 지키기 어려운 추상적인 개념이겠지만, 상호간에 지켜야할 예의이기 때문이다. 만약, 개발중인 서비스에서 크롤링을 사용하고 있다면 적어도 위 요약 중 어기고 있는 사항이 없을지 고려해보아야 할 것이다.
결론은
조심, 또 조심하셔야 합니다!