RDF

이혜윤·2023년 1월 10일
2

1) 트리플(Triples)

<주어> <술어> <목적어>

  • RDF 문장은 두 자원 간의 관계를 표현
  • <주어> <목적어> = 두 자원
  • <술어> = 관계의 특징
  • 관계는 주어에서 목적어로 방향성을 가지며, 속성(Property)라고 명명
<Bob><is a><person>
<Bob><is a friend of><Alice>
<Bob><is born on><the 4th of July 1990>
<Bob><is interested in><Mona Lisa>
<the Mona Lisa><was created by><Leonardo da Vinci>
<the video><is about><the Mona Lisa>
  • 트리플들은 연결된 그래프로 시각화 가능
  • 트리플에서 주어와 술어는 그래프에서 노드로 구성됨

2) RDF 어휘

구성 요소구문 형식설명
Class(클래스)C rdf:type rdfs:ClassC(자원)는 RDF 클래스
Property(클래스)P rdf:type rdf:Propertyc2
Type(속성)I rdf:type CI(자원)는 C(클래스)의 인스턴스
SubClassOf(속성)C1 rdfs:subClassOf C2C1(클래스)는 C2(클래스)의 서브
subPropertyOf(속성)P1 rdfs:subPropertyOfP2P1(프로퍼티)은 P2(프로퍼티)의 하위 프로퍼티
domain(속성)P rdfs:domain CP(프로퍼티)의 도메인은 C(클래스)
range(속성)P rdfs:range CP(프로퍼티)의 레인지는 C(클래스)

3 ) RDF vs Graph DB

항목RDFGDB
목적연결된 데이터를 표현할 때 RDB에 저장하기 쉽게 개발된 형태시맨틱 웹을 잘 처리할 수 있는 DB 형태의 모델로 개발된 형태
데이터 모델Triplet SchemaProperty Graph Model
탐색성능recursive table search로 인해 depth가 깊어질수록 매우 느림그래프 구조별 최적화된 그래프 Path 알고리즘 사용
데이터 모델 예시모든 데이터를 노드 또는 엣지에 저장해야하므로 속성정보가 많을 수록 복잡해짐Property 등을 활용하여 시스템적으로 가볍고, 논리적으로 직관적인 표현이 가능함
기타 장단점자연어를 저장하기에 효율적, 그래프 구조에 대한 표현에 한계가 있음, DB 형태로 개발된 것이 아니기에 관리 시스템으로서 기능 부족, 정해진 양의 데이터 또는 학술적인 용도로 사용될 때 적합패턴 탐색(질의)기반 서비스 제공, 스키마리스 저장방식으로 새로운 형태의 데이터가 추가되더라도 유연하게 대처, 관계 모델링이 복잡하여 쉽게 구성하기 어려움, 비즈니스 및 빅데이터 분석 등 데이터가 새롭게 생성되는 환경과 같이 실용적인 용도로 사용할 때 효율적

4 ) 알기 쉬운 Linked Open Data _한국정보화진흥원/미래창조과학부

  • ‘서울 데이터’가 관련 데이터인 ‘대한민국 데이터’로 연결되는 모습은 <그
    림2>에서 나타낸 하나의 HTML 문서가 관련된 다른 HTML문서로 연결되는 모습과
    유사합니다. 그러나 LOD에서는 보다 중요하고 차별화된 점이 존재합니다. LOD는
    완성된 HTML형태 문서를 제공하는 것이 아니고 특정 개념(사실상 사람이 생각할
    수 있고 존재하는 모든 것)과 이 개념이 갖는 특성(속성)을 구조적으로 제공하는 것
    입니다. 따라서 모두가 이 데이터를 이용하고 특히 기계가 처리하기 위해서는 엄격
    하고 명확한 정의가 필요합니다.
  • <그림 3>에서와 같이 서울이라는 데이터를 설명하는 요소에는 ‘공식명칭’,
    ‘국가’, ‘관련산’ 등이 존재합니다. 이 요소들을 명확하게 하는 방법은 이 요
    소들이 의미하는 바를 명확하게 하는 것입니다. 예를 들면 ‘공식명칭’이라는 요
    소는 ‘특정 개념을 대표할 수 있는 것으로 약어, 속어 등을 사용하지 않고 법제도
    적으로 인증된 이름’으로 그 범위를 명확하게 하는 것입니다.
  • ‘서울’이라는 개념은 ‘도시’라는 개념에 속하는 것으로 위의 예시와
    같이 ‘도시’라는 개념이 의미하는 바가 무엇이고 어떤 영역에서 사용이 가능한
    것인지를 상세하게 표현한 설계서(온톨로지)
    를 참조합니다

5) URI와 URL의 차이

  • URI란 인터넷 상의 자원을 식별하기 위한 문자열의 구성

  • URL이란 인터넷 상의 자원 위치를 뜻함

    6) SPARQL

  • SPARQL Protocol And RDF Query Language

  • RDF 형식이나 RDF 형태의 구조화된 데이터를 처리하기 위한 질의 언어

6.1 예제

profile
구르미 누나

0개의 댓글

관련 채용 정보