팔란티어와 온톨로지

zoo_gathers·2025년 9월 4일
0

Ontology

목록 보기
1/1

이번시간에는 온톨로지라는 개념에 대해서 공부를 해보고자 한다.

해당 내용은 다음 강의 영상을 통해 정리되었다.

팔란티어와 온톨로지

정말 유익한 강의이니 꼭 한번 시청하는 것을 추천한다.

우리는 건강, 공부, 성공이라는 개념에 대해서 이야기를 할 때 어떻게 대화가 진행되는가?를 살펴보면 개인마다 추구하는 가치관이 모두 다르기 때문에 각자 다른 의미로 해석이 될 수 있다.

예를 들어 "건강해진다는 것은 무엇을 의미할까?" 라는 질문에 대해서 다음과 같은 답이 나올 수 있다.

  • "나는 암을 치료하는 것이 건강이라고 생각해",
  • "나는 변비가 없는 것이 건강하다고 생각해",
  • "나는 걸을 수 있다면 그건 건강하다고 생각해"
  • "나는 오래 산다면은 건강하다고 생각해"

이와 같이 모든 사람들은 건강이라는 개념에 대해서 다른 기준으로 평가를 하게 된다.

그럼 진정으로 건강해지기 위해서는 무엇을 해야 할까?

이는 각자의 상황을 확인해 보아야 한다. 내가 현재 건강하고자 하는


온톨로지 기술을 전문적으로 활용하는 팔란티어라는 기업에 대해서는 다들 자주 들어봤을 것이다.

우리는 오늘 팔란티어 기업이 무슨 기업인지, 그리고 해당 기업에서 이야기하는 온톨로지는 무엇을 의미하는지, 이렇게 2가지에 대해서 깊에 이야기하고자 한다.


팔란티어 기업과 시스템의 핵심

팔란티어라는 기업은 2003년에 만들어진 기업으로 간단히 말하면 빅데이터를 분석해서 최적의 솔루션을 내주는 IT 기업이다.

A라는 기업이 팔란티어에게 의뢰를 하게 되면 팔란티어 기업은 A 기업의 모든 정보를 디지털화한 후 각 정보들 사이의 논리적 관계를 찾아내고 이후 시스템 안에서 최적의 해결책이 나오게끔 만들어 준다.

다시 말해서 A라는 기업을 디지털화된, 논리화된 생태계로 만들어주는 것이다.

이것이 바로 팔란티어 시스템의 핵심이다.
팔란티어 기업은 대상을 디지털화하고, 논리화하여 객관적인 판단이 가능하도록 돕는다.

그럼 이렇게 논리화를 진행하면 무엇이 좋을까?

"기업이라는 자체를 디지털화 한다고?" 이러한 말만 들어도 좋아보일 것이다.
AI가 활용하기 쉬운 형태이기도 하고, 빠른 객관적인 판단이 가능하게 보이기 때문이다.

하지만 보다 저 중요한 점은 바로 "객관화"에 있다.


기업내에 있는 모든 부서들의 정보와 문제들을 눈에 보이게 가시화 시켰을 때 가장 큰 장점은 바로 기업의 문제들이 제대로 객관화 된다는 점이다.

이렇게 가시화를 통해 전체의 문제들을 제대로 파악하게 되면 비로소 진짜 문제가 무엇인지 파악할 수 있게 되고, 이때 최선의 의사결정이 가능하게 된다.

즉 현재 바쁜 업무들이 많은데, 거기서 진짜 해결해야 하는 문제와 그렇지 않은 잡다한 업무들을 분리시켜, 바로 해결해야 하는 것들을 파악시켜준다는 것이다.


이미지 출처: 팔란티어와 페라리 그리고 레거시 사업

위 이미지와 같이 회사들의 모든 문제들을 가시화시켜 각각 우선 순위를 비교함으로써 최종 목표를 설정하고, 설정한 목표에 맞게 현재 해결해야 하는 것들과 나중으로 미루어도 되는 것들을 알게 되면 회사 운영 측면, 의사결정 측면에서 논리 기반으로 해결이 가능하다는 장점이 존재한다.

간단히 정리하면 다음과 같다.

- 진짜 문제를 찾아내기 위해

- 존재하는 모든 문제들을 검토

- 감정을 배제후 판단 진행

장점: 논리 기반, 사람의 사고가 들어가지 않음, 우선 순위 기반 목표 달성

그럼 위 내용만을 봤을 때 팔란티어 기업은 무엇을 하는 기업이냐?

위에서도 설명했지만 팔란티어는 기업의 모든 데이터를 온톨로지라는 언어로 재구성해서 하나의 통합 OS로 만들어주는 일을 한다.

간단히 말하면 사람의 언어로 구성되어 있는 기업을 AI와 결합하거나 논리적으로 판단하기 위해서는 수학적 언어로 기업을 재구성해야 한다는 것이다.


Ontology

Ontology = 데이터들의 일정한 규칙

그럼 위에서 팔란티어가 기업을 온톨로지라는 언어로 재구성한다고 했는데, 온톨로지가 뭔데?

과거 세상에 WWW, world wide web이 나오면서 웹상에 수많은 데이터들이 생성되기 시작했다.
지금까지 정말 많은 데이터들이 생성되었지만, 이러한 데이터들은 모두 규칙없이 산발적으로 존재했다.

이러한 이유로 정말 필요한 정보들은 검색하기 어려웠고, 인공지능이 나오더라도 웹상의 정보들에는 규칙이 없었기 때문에 인공지능이 웹 데이터를 이해하지 못할 가능성에 대한 우려가 생겼다.

이러한 문제를 해결하기 위해서 우리는 점차 웹상의 데이터에 일정한 규칙들을 부여하기 시작했고, 이로 인해 데이터의 정형화와 보안성 강화 그리고 인공지능이 이해할 수 있는 자동화가 이루어졌다.

여기서 말한 데이터들의 일정한 규칙이 바로 온톨로지이다.

즉 온톨로지는 팔란티어가 만든 새로운 개념이 아니라 기존에 존재하던 개념을 가져와서 기업의 데이터에서 온톨로지를 구현한 것이라고 할 수 있다.

조금 쉽게 말하면 온톨로지는 무규칙한 데이터에 규칙을 부여한 것이라고 할 수 있다.


예를 들어서 확인해보자.

애플과 삼성의 스마트폰은 서로 다른 모양과 시스템을 가지고 있다.

하지만 아이폰과 갤럭시 각자의 환경에서 앱을 만든다고 가정을 했을 때 갤럭시의 경우 안드로이드 스튜디오를 활용하면 이미 정해진 규칙에 따라 개발자가 코드를 입력해 앱 개발하는 것이 가능해진다.

이처럼 애플은 애플만의 규칙으로, 삼성은 삼성만의 규칙으로 표현될 수 있게 시스템을 미리 구축해놓았다고 할 수 있다.

그럼 팔란티어는 스마트폰이 아닌 이 세상에 실존하는 사물들에 대해 팔란티어만의 규칙으로 범위 안에 표현될 수 있게 시스템을 구축해 놓았다고 생각하면 된다.

이미지 출처: https://brunch.co.kr/@mentats1/206

위 이미지를 보면 쉽게 이해할 수 있다.

위 이미지는 비행산업에 존재하는 실제 개념들을 팔란티어만의 규칙에 맞춰 각각의 속성들을 기록해 표현해 놓은 것이다.

위 이미지가 온톨로지화 된 비행산업이라고 생각하면 어렵지 않을 것이다.


우리는 데이터들을 위와 같이 온톨로지화하고

온톨로지화된 데이터들이 서로 유기적인 관계를 이루고 있는 하나의 시스템을 디지털 트윈이라고 부른다.

디지털 트윈에 대해 정의한 하나의 글을 가져와 보았다.

디지털 트윈은 현실 세계의 사물, 시스템, 인체 등을 실시간 데이터와 연동하여 항상 작동하는 동적 가상 복제본을 의미

간단히 말하면 DT(디지털 트윈)은 실존하는 존재를 디지털로 구현하여 컴퓨터 공간에 구축해놓은 것을 말한다.

그럼 DT는 왜 필요한 것일까?

우리는 온톨로지를 통해 실제 세계를 가상으로 구현해 놓은 것이 디지털 트윈이라고 했고,
DT를 구성하게 되면 다음과 같은 이점이 따른다

  • 한눈에 볼 수 있어 데이터 분석이 매우 용이하다
  • 미리 시뮬레이션이 가능하다
  • 인공지능과의 결합이 수월해진다.

이렇게 우리가 온톨로지를 진행하게 되면 모든 데이터들이 정확한 근거를 가지게 되고, 사람들의 추상적인 생각이 아닌 명확히 근거가 존재하는 데이터를 기반으로 정리했기 때문에 누구라도 명백하게 판단이 가능하게 된다.

이게 바로 온톨로지의 가장 중요한 부분이다.

따라서 우리는 데이터들의 온톨로지화를 통해 추상적인 개념이 아닌 정확히 근거가 존재하는 데이터들을 수학적으로 표현해 정리해야 하고, 이렇게 정리된 즉 온톨로지화된 데이터를 기반으로 디지털 트윈으로 구성해서 활용해야 하는 것이다.

profile
전공: 소프트웨어, 관심 분야: LLM, NLP, 지식 그래프

0개의 댓글