데이터의 가치

김하루·2023년 4월 5일

Digital Leader Google Cloud Google 자격증 구글클라우드 자격증

GCP digital Leader

목록 보기

5/12

소개

데이터는 오늘날의 비즈니스 세계에서 많이 사용되는 용어이며 그럴만한 이유가 있다.
데이터 캡처, 관리 및 활용은 거의 모든 산업에서 고객 경험을 재정의하고 새로운 가치를 창출하는데 핵심이다.

이 섹션에서는 아래 내용에 대해 알아볼 예정이다.

1) 데이터란 무엇이며, 디지털 혁신에서 데이터의 역할은 무엇인가?
2) 조직에서 데이터를 활용할 수 있는 방법
3) 데이터 유형을 분석
4) 클라우드에서 데이터를 사용하는 비즈니스에 대한 중요한 데이터 고려 사항

디지털 전환에 있어 데이터의 역할

데이터란 조직에 유용한 모든 정보이다.

스프레드 시트, 이메일, 오디오, 비디오 등등이 여기에 포함된다.

기업은 이제 전혀 다른 방법으로 데이터에 접근할 수 있는데, 조직 내부 데이터, 고객 및 산업 데이터 등이 포함된다.

조직이 운영을 디지털화함에 따라 재무 정보, 물류데이터, 생산 결과, 품질 보고서 등 모든 종류의 비즈니스 데이터를 사용할 수 있게 되었다.

기업은 또한 고객에 대한 새로운 종류의 데이터에 액세스 할 수 있다.

사용자가 웹 페이지에서 보내는 시간, 소셜 미디어 게시물에 대한 반응과 같은 디지털 상호 작용 등이 예시이다.
이것들은 고객 행동에 대한 새롭고 풍부한 정보 소스가 된다.

인터넷은 또한 산업 벤치마킹 보고서와 같은 외부 데이터에 대한 액세스를 증가시켰다.

이 데이터를 캡쳐하고 활용하여 비즈니스 가치를 실현하는 것이 디지털 혁신의 핵심이다.

기존 IT 인프라를 갖춘 대기업은 데이터 가치를 활용하는데 있어 몇 가지 제한 사항에 직면해 있다.

데이터 센터 설정 및 유지보수를 위한 비용 효율적인 솔루션 찾기.
리소스 용량을 확장하거나 축소하고, 특히 연중 최대 수요 시간에 전 세계적으로 용량을 조절하기.
종종 다른 형식과 플랫폼에 저장되는 기록 데이터에 액세스하기.

시간과 비용 효율적인 방식으로 과거 데이터와 새로운 데이터로부터 인사이트를 도출한다.

Google Cloud 같은 Public Cloud는 조직에 비용 조정, 빠른 탄력성, 자동화를 제공한다.

이를 통해 조직은 전체 에코시스템에서 조각난 데이터와 플랫폼을 통합시킬 수 있다.

특히 클라우드는 한 때 거의 불가능했던 데이터 솔루션을 제시했다.

기업은 이제 테라바이트의 데이터를 실시간으로 소비, 저장 및 처리하고 요청 시 쿼리를 실행하여 즉시 데이터를 검색하고 사용 할 수 있으며, 리소스는 이제 글로벌 네트워크에 분산시킨다.

이는 여러 데이터 센터가 데이터 손실 또는 서비스 중단에 대해 별도 비용 없이 회복(resilience)을 할 수 있음을 의미한다.

또한 데이터를 신속하고 비용 효율적으로 결합, 분석하여 비즈니스 팀에 제공할 수 있다.

이는 많은 기업에서 처음으로 데이터 통찰력이 비즈니스 전반에 걸쳐 매우 정확하고 액세스 가능하며 이제는 혁신을 가능하게 한다는 것을 의미한다.

데이터의 가치를 실현하여 비즈니스를 혁신한 조직의 몇 가지 예를 보자

저예산 항공사는 서비스로 음식을 제공하지 않고 원하는 경우에 비용을 청구하고 제공한다.
이것은 비용 효율적인 솔루션처럼 보일 수 있는데, 필요한 식사 수를 추정하기가 어려운 경우가 많다.
많이 먹을 것 이라고 예측하고 음식을 준비하면 음식이 버려지고 수익을 잃을 위험이 생긴다.
적게 먹을거라고 생각하고 준비를 안하면 고객 서비스의 타격을 입을 수 있다.

아시아의 한 항공사에서는 데이터를 활용하여 이 문제를 해결할 수 있는 방법을 재 구상 했다.
먼저 그들은 비행기의 크기와 승객 수와 같이 재고를 추정하는데 도움이 되는 요소를 식별했지만, 이러한 요소를 기반으로 한 추정은 그다지 정확하지 않다는 것을 알고 데이터에 대해 다르게 생각해야 한다는 것을 깨달았다.

그래서 항공편, 목적지, 시간, 환승편과 같은 추가 정보를 분석했다.
이 정보를 사용하여 인사이트를 발견했다.
예를 들자면 인도 항공편에서는 채식 비율이 높다는 것을 알게 되었다.

조직에서의 데이터 활용

데이터 맵은 비즈니스 프로세스에서 사용되는 모든 데이터의 차트이다.

예를 들어 의류 소매점 체인을 소유하고 있다고 생각해보자.

데이터 맵에 무엇을 포함할 수 있을까?

고객이 매장 중 한곳에서 물품을 구매한다.
그것은 데이터 포인트다.
각 다른 지점에서 다른 구매와 함께 집계하면 이것을 데이터 세트라고 한다.

Transactions, Returns, Footfall등 이러한 모든 데이터 세트가 사용자에 관한 것이다.
따라서 사용자 데이터는 첫 번째 데이터 버킷이 된다.
이 카테고리에서 제품과 서비스를 사용하거나 구매하는 고객의 모든 데이터가 포함된다.

운영 적인 측면에서 보자면, 각 매장의 인력 수준, 재고 배송 날짜, 각 매장의 판매 실적, 매장 인력 구조 등은 두 번째 버킷인 기업 데이터로 볼 수 있다.
여기서 판매 패턴 및 운영과 같은 회사에 대한 데이터가 포함된다.

세 번째 범주는 사용자 및 기업 데이터를 엮은 것인데 이것을 산업 데이터라고 한다.
산업 데이터는 특정 도메인에 대한 지식을 얻기 위해 해당 분야의 모든 사람이 보거나 액세스해야 하는 개별 조직 외부에서 발견되는 데이터이다.
여기에는 더 넓은 트렌드와 구매 패턴, 논문 등을 포함할 수 있다.

이러한 세 개의 버킷이 데이터 맵을 구성한다.
각 버킷에 더 많은 데이터 세트를 추가하면 더 많은 인사이트를 뽑아 낼 수 있다.

단순히 각 데이터 세트만 보지 말고 데이터 세트의 결합으로 인사이트를 뽑는게 중요하다

데이터 타입의 이해

데이터 결합을 더 잘하기 위해 두 가지 유형의 데이터와 이 유형이 비즈니스에서 의미하는 바에 대해 알아보자.

Structured Data

구조화된 데이터이다.
이름, 주소, 신용 카드 번호 및 기타 양적 데이터로 구성된 고객 기록
데이터베이스에 쉽게 저장이 가능하다.

Unstructured Data

구성이 없고 질 적인 경향이 있다.
워드 프로세싱 문서, 이미지, 오디오 등이 있다.
이 데이터는 개체로 저장할 수 있다.
개체는 데이터 자체, 다양한 양의 메타데이터 및 전역적으로 고유한 식별자로 구분된다.

일부 비정형 데이터는 BLOB(Binary Large Object)이라는 형식으로 저장할 수 있다.

조직은 정형, 비정형 데이터를 모두 활용하여 인사이트를 얻고 결정을 내린다.
그러나 비정형 데이터는 역사적으로 분석하기가 매우 어려웠는데 클라우드 기술이 이를 변화시켰다.

정형 데이터와 비정형 데이터를 모두 활용할 수 있는 중고차 대리점의 예를 살펴보자.

고객이 자동차를 대리점에 가져갈 떄 마다 에이전트는 각 자동차의 사진을 수동으로 업로드하고 라벨을 붙인다음 모델과 상태에 따라 가격을 설정해야 했다.

이 프로세스는 차량당 평균 20분이 소요됐다.

이 경우 자동차 대리점에서 자동화를 사용하여 더 나은 프로세스를 만드는 방법은 무엇일까?

그들은 기계 학습 모델을 개발하기로 했다.
(다음 주제에서 다룰 예정)

구조화되지 않은 데이터인 사진을 구조화된 데이터인 가격 정보와 결합했다.
그런 다음 결합된 데이터를 활용하여 자동차 금액에 대한 예측을 만들어 냈다.

이 새로운 접근 방식을 통해 차량을 촬영하고 평가하는 모든 프로세스가 20분에서 2~3분으로 줄어들었다.

중요한 데이터 고려

방대한 양의 데이터를 캡쳐하고 저장하고 분석하는 것이 클라우드 기술을 채택하는데 핵심이다.
그러나 이러한 양과 다양성의 데이터를 처리하려면 윤리적 고려 사항이 수반되며 보안에 대한 대안적 사고 방식이 필요하다.

Google은 데이터 캡처 및 관리에 있어 책임감이 필요하다고 믿는다.

캡쳐 할 수 있는 데이터가 캡쳐를 해야하는 데이터는 아니다.
즉 조직은 저장 및 분석할 데이터에 대한 책임 있는 결정을 내릴 필요가 있다.

이것은 또한 기업이 이미 소유하고 있는 데이터를 확장시킨다.

또한 데이터에 액세스 할 수 있는 사람과 데이터를 사용하는 방법을 조사하는 것이 중요하다.

먼저 데이터 소스, 데이터 수집 방법, 저장 위치를 고려하자.

개인 데이터 또는 민감한 데이터의 경우에는 안전하게 수집하고 클라우드에 저장할 떄 암호화를 하고 외부 위협으로부터 보호해야 한다.
또한 일부 사용자만 볼 수 있도록 액세스 권한을 부여한다.

데이터 보안 및 개인정보 보호는 글로벌에서 더 복잡해진다.
지역 또는 산업별 규정은 종종 데이터 정책을 안내한다.
Google Cloud는 기업에서 사용할 수 있는 권장사항 리소스를 제공한다.

또 다른 고려사항은 모든 데이터가 관련되어 있고 적절한지 여부이다.

예를 들어 수천개의 X선 폐 이미지를 활용하여 새로운 환자 X선에서 폐에 종양 표시를 자동으로 식별하도록 ML 모델을 훈련한다고 가정하자.

필요한 것은 X-Ray 이미지이다.
필요 없는 것은 개인 환자의 정보이다.

비정형 데이터의 경우에 더 윤리, 개인 정보 보호 정책을 지키기가 복잡하다.

예를 들자면, 수백 건의 고객 문제를 해결하는 고객 지원 팀은 자동화된 도구를 통해 이메일 구절에서 패턴을 찾고 대상 솔루션을 개발하고 싶을 수 있다.

이메일에 귀중한 데이터가 포함되어있는지 등을 알고 보호를 하는 것이 중요하다.

김하루

이전 포스트

--------------------------구분선--------------------------

다음 포스트

데이터의 가치

GCP digital Leader

소개

디지털 전환에 있어 데이터의 역할

조직에서의 데이터 활용

데이터 타입의 이해

Structured Data

Unstructured Data

중요한 데이터 고려

--------------------------구분선--------------------------

데이터의 결합과 분석

0개의 댓글