1) 트리플(Triples)
<주어> <술어> <목적어>
<Bob><is a><person>
<Bob><is a friend of><Alice>
<Bob><is born on><the 4th of July 1990>
<Bob><is interested in><Mona Lisa>
<the Mona Lisa><was created by><Leonardo da Vinci>
<the video><is about><the Mona Lisa>
2) RDF 어휘
구성 요소 | 구문 형식 | 설명 |
---|---|---|
Class(클래스) | C rdf:type rdfs:Class | C(자원)는 RDF 클래스 |
Property(클래스) | P rdf:type rdf:Property | c2 |
Type(속성) | I rdf:type C | I(자원)는 C(클래스)의 인스턴스 |
SubClassOf(속성) | C1 rdfs:subClassOf C2 | C1(클래스)는 C2(클래스)의 서브 |
subPropertyOf(속성) | P1 rdfs:subPropertyOfP2 | P1(프로퍼티)은 P2(프로퍼티)의 하위 프로퍼티 |
domain(속성) | P rdfs:domain C | P(프로퍼티)의 도메인은 C(클래스) |
range(속성) | P rdfs:range C | P(프로퍼티)의 레인지는 C(클래스) |
3 ) RDF vs Graph DB
항목 | RDF | GDB |
---|---|---|
목적 | 연결된 데이터를 표현할 때 RDB에 저장하기 쉽게 개발된 형태 | 시맨틱 웹을 잘 처리할 수 있는 DB 형태의 모델로 개발된 형태 |
데이터 모델 | Triplet Schema | Property Graph Model |
탐색성능 | recursive table search로 인해 depth가 깊어질수록 매우 느림 | 그래프 구조별 최적화된 그래프 Path 알고리즘 사용 |
데이터 모델 예시 | 모든 데이터를 노드 또는 엣지에 저장해야하므로 속성정보가 많을 수록 복잡해짐 | Property 등을 활용하여 시스템적으로 가볍고, 논리적으로 직관적인 표현이 가능함 |
기타 장단점 | 자연어를 저장하기에 효율적, 그래프 구조에 대한 표현에 한계가 있음, DB 형태로 개발된 것이 아니기에 관리 시스템으로서 기능 부족, 정해진 양의 데이터 또는 학술적인 용도로 사용될 때 적합 | 패턴 탐색(질의)기반 서비스 제공, 스키마리스 저장방식으로 새로운 형태의 데이터가 추가되더라도 유연하게 대처, 관계 모델링이 복잡하여 쉽게 구성하기 어려움, 비즈니스 및 빅데이터 분석 등 데이터가 새롭게 생성되는 환경과 같이 실용적인 용도로 사용할 때 효율적 |
4 ) 알기 쉬운 Linked Open Data _한국정보화진흥원/미래창조과학부
5) URI와 URL의 차이
URI란 인터넷 상의 자원을 식별하기 위한 문자열의 구성
URL이란 인터넷 상의 자원 위치를 뜻함
6) SPARQL
SPARQL Protocol And RDF Query Language
RDF 형식이나 RDF 형태의 구조화된 데이터를 처리하기 위한 질의 언어
6.1 예제