Apache ManifoldCF란?

NoCoDe·2021년 10월 18일
0

Apache ManifoldCF는 인터넷이나 인트라넷의 다양한 서버에 저장되어있는 문서 파일이나 Web 페이지 등 콘텐츠를 수집하고이를 검색 엔진에 전달하는 Java 프로그램이다.

Apache ManifoldCF는 MetaCarta, Inc. 의해 개발되었으며, 5 년의 세월 동안 여러 기업에 개발 / 테스트를 반복 한 후 2009 년 12 월에 Apache Software Foundation에 코드 소스가 기증되었다.

또한, 콘텐츠를 수집 할 때 ActiveDirectory 등 인증 기반과 연계하여 콘텐츠마다 권한 정보를 수집하고 검색 할 때 그 권한 정보를 이용하여 표시 내용을 제한 할 수 있다.
예를 들어 인사 정보에​​ 관한 문서는 인사팀 등의 권한 사용자가 검색했을 때만 표시하도록 할 수 있다.

현재 버전의 ManifoldCF는 FileNet P8 (IBM), Documentum (EMC), LiveLink (OpenText) Meridio (Autonomy), Windows 공유 (Microsoft), SharePoint (Microsoft)와 같은 상용 제품에 저장되어있는 내용과 다음 같은 범용 커넥터를 사용하여 다양한 콘텐츠를 수집 할 수 있다.

Connector 종류

  1. CMIS 커넥터
  2. Documentum 커넥터
  3. DropBox 커넥터
  4. EMail 커넥터
  5. FileNet 커넥터
  6. 파일 시스템 커넥터
  7. GoogleDrive 커넥터
  8. GridFS 커넥터
  9. HDFS 커넥터
  10. Jira 커넥터
  11. Meridio 커넥터
  12. SharePoint 커넥터
  13. JDBC 커넥터
  14. RSS 피드 커넥터
  15. Wiki 커넥터
  16. HTML 커넥터

Connector에 의해 수집 된 데이터를 Apache Solr, QBase (구 MetaCarta) GTS, Open Search Server, ElasticSearch에 보낼 수 있다.

  • 구성도

  • Crawler -Agent

  • 권한검색

profile
Search engine developer / platform architect - software engineer

0개의 댓글