학습목표
- 데이터 비즈니스의 개요를 말할 수 있다.
- 분야별 데이터 비즈니스 사례를 말할 수 있다.
데이터 비즈니스의 개요
배경
Q. 빅데이터 기반 인사이트 도출의 중요성이 강조되고 있습니다. AI 시대를 맞아 데이터가 중요한 이유는 무엇인가요?
- 의료 분야 인사이트 도출 사례
- 의사가 X선 영상, MRI 영상이라는 데이터를 분석하여 골절이라는 인사이트를 도출하고, 이를 바탕으로 깁스 처방과 투약이라는 의사 결정을 내림 → 결과적으로 환자의 완치라는 가치가 창출되는 것
- X선 영상 없이 환자의 구두 증상에만 의존했던 때에는 정확한 진단이 어려웠음
- 현대 기업 환경 또한 데이터 기반 의사결정이 필수적
- 단, 데이터의 질적 수준이 보장되어야 함
- 부정확한 X선 영상이 오진으로 이어질 수 있듯 부실한 데이터는 잘못된 의사결정을 초래할 수 있기 때문
국가 정책방향
국가 AX 전면화


- AI 혁신 역량을 극대화하고 민간 투자를 확대하기 위해 AI 인프라를 확충하고, AI를 국가 인프라로 전환하는 정책을 추진할 계획
- 다양한 분야에서 AI를 전면적으로 활용하기 위한 '국가 AX 전면화' 추진
마이데이터 2.0의 개요: 금융 분야 마이데이터 서비스
- 2022년 1월부터 본격 시행
- 주요 역할
- 금융회사가 보유한 개인 신용정보를 수집하고 통합하여 신용정보의 주체인 금융소비자가 이를 조회하고 열람할 수 있도록 도움
- 소비자가 자신의 금융 자산과 거래 내역을 종합적으로 관리할 수 있으며 맞춤형 금융상품 비교, 추천, 신용 점수 올리기, 대환 대출 등 다양한 부가 서비스 이용 가능
시장 현황

- 2023년 데이터산업은 총 3개 대분류와 10개 중분류로 구성
- 부문별 시장 규모 잠정치
- 데이터 판매 및 제공 서비스업 시장: 13조 3,352억 원
- 데이터 구축 및 컨설팅 서비스업: 9조 3,268억 원
- 데이터 처리 및 관리 솔루션 개발/공급업: 4조 4,894억 원
시장 규모 추이
- '2022년 기업경영분석'(한국은행): 2018년부터 2022년까지 연평균 성장률

- 국내 전 산업: 7.4%
- 정보통신서비스업(데이터산업과 유사): △4.4% → -4.4%
- 정보통신기술산업: 1.5%
- 서비스업: 8.3%
- 데이터산업: 13.6% → 비교적 높은 증가세
→ CAGR(Compound Annual Growth Rate): 연 단위로 얼마나 성장했는가
△4.4% likely refers to a decrease or negative change of 4.4%
- 데이터산업은 디지털 경제의 원천
- AI, 클라우드 컴퓨팅 등 디지털 기술 및 ICT 인프라를 바탕으로 데이터가 축적됨에 따라 성장세를 지속 유지할 것으로 전망
- 전 산업에서 데이터와 융합된 디지털 전환(Digital Transformation, DX)과 이를 위한 데이터 산업 생태계 강화 및 거버넌스 체계 구축이 강조됨에 따라 데이터 직무 인력에 대한 수요 역시 증대 → 각 분야와 데이터의 콜라보 & 융합
분야별 데이터 비즈니스
데이터 비즈니스의 주요 산업 분야
- 금융 분야
- 제조 분야
- 유통/물류 분야
- 에듀테크분야
- 농업분야
금융 분야
개요
- 전통적으로 데이터 활용에 있어 보수적인 성향을 보임
- 금융 거래의 안정성과 보안이 최우선됨
- 금융업의 규제와 법적 요건이 엄격해 데이터 처리에 대한 신중함이 필요했음
- 최근 디지털화와 기술 혁신의 빠른 발전에 따라 데이터의 중요성이 급증
- 빅데이터, 인공지능(AI), 블록체인 등 첨단 기술이 금융 서비스에 도입되면서, 고객 맞춤형 서비스, 리스크 관리, 자동화 등 다양한 분야에서 데이터 활용이 핵심적인 역할을 하게 됨
→ 핀테크, 블록체인 네크워크
→ 블록체인은 독특한 알고리즘을 기반으로 한 암호화 기술을 기본 베이스로 하기 때문에 금융 분야에서 인기가 많음: 암호화, 보안성 고도화 가능 기술이기 때문에 금융 분야는 블록체인을 기반으로 빅데이터나 인공지능을 결합하는 편
- 금융산업에서 데이터의 활용은 경쟁력 확보와 효율성 증대의 중요한 요소로 자리매김함
데이터비즈니스와 AI 기술
- 클라우드 컴퓨팅, 빅데이터 분석, 인공지능(AI), 블록체인 등의 첨단 기술이 금융 서비스에 접목됨
- 데이터를 분석하고 이를 기반으로 다양한 금융상품을 제공
- 디지털화와 기술 혁신의 빠른 발전에 따라 데이터의 중요성이 급증
- 고객 맞춤형 서비스, 리스크 관리, 자동화 등 다양한 분야에서 데이터 활용이 핵심적인 역할을 하게 됨
- JP모건 체이스
- COiN(Contract Intelligence) 시스템 개발 → 업무 효율성 대폭 향상
- 생성형 AI를 활용해 복잡한 계약서를 분석하고, 고객에게 맞춤형 금융 솔루션을 제공
- DocLLM(영수증, 계약서 등 회계 문서를 쉽게 이해하는 LLM 모델) 공개
- 금융에 활용되는 서식 등은 표와 그림 등 다양한 형태로 작성되고 정보의 형태도 다양함 → 정보 추출이 어려움
- chatGPT가 범용적인 문서를 이해하는 것이라면, DocLLM은 금융 문서만 활용하는 분야에 특화된 것

제조 분야
개요
- 제품 기획부터 생산, 운영에 이르기까지 데이터를 활용하여 기업 가치를 창출하는 중요한 활동으로 부상하고 있음
- 제조 데이터 스페이스는 기업 간 안전한 데이터 공유와 협력을 촉진하며 이를 통해 생산성 향상, 비용 절감, 품질 개선 등 다양한 이점을 제공함
- 비슷한 고민을 가진 업체끼리 ally를 해서 공공 데이터 포털 등에 올라오는 데이터와 비교해 좀 더 양질의 데이터를 얻을 수 있음
- 제조분야에 제안된 주요 프로젝트들은 데이터 표준화와 상호 운용성을 강화하고, 예측 유지보수와 같은 새로운 비즈니스 모델을 가능하게 하여 제조업의 디지털 전환을 가속화하고 있음
소코반 알고리즘
데이터비즈니스 특징
- 현대 제조업의 핵심 동력으로 부상하고 있음
- 제품의 기획부터 설계, 생산, 공장 운영에 이르는 전 과정에서 발생하는 방대한 양의 디지털 정보를 효과적으로 활용하여 기업의 가치를 창출하는 활동을 의미
- 제조 데이터는 그 특성상 대용량이며 다양한 형태를 가짐
- 센서와 설비에서 실시간으로 수집되는 데이터는 빠르게 대규모 데이터셋을 형성하며 설비 운영부터 공장 관리, 에너지 소비, 환경 모니터링에 이르기까지 다양한 영역을 아우름
→ 지금까지는 OQC 단계에서만 쓰는 경우가 대부분임
- 기업들은 이러한 데이터를 활용하여 생산성을 향상시키고, 제품 품질을 개선하며, 비용을 절감하는 등 다양한 목적을 달성하고자 함
- 설비 가동률 개선 및 생산 라인 최적화 → 생산성 향상
- 실시간 품질 모니터링 및 불량 예측 → 제품 품질 향상
- 사입한 부품의 불량 관리에 AI를 활용: 누적된 데이터를 시계열로 분석
- 에너지 사용 최적화 및 재고 관리 효율화 → 비용 절감
- 데이터에 기반한 신속하고 정확한 의사결정 지원
- 시장 트렌드와 고객 니즈를 분석 → 신제품 개발
자동차공급망 데이터스페이스 Catena-X
- Catena-X: 유럽의 자동차 산업에서 데이터 교환과 상호운용성을 촉진하기 위해 설계된 프로젝트
- 자동차 공급망의 디지털화와 효율성 향상을 목표로 함
- 유럽의 데이터 주권을 보장하는 이니셔티브의 일환(cf. Gaia-X)
- 데이터 보안을 유지하면서도 효율적이고 투명한 공급망을 만들기 위해 2021년 Catena-X Automotive Network라는 이름으로 BMW, 지멘스 등 30여 개 기업의 참여로 출범
- 자동차 산업 → 부품 제조업체에서 완성차 제조업체에 이르기까지 여러 단계의 생산과 조립 과정이 긴밀하게 연결: 매우 복잡한 공급망을 가짐
- 전통적인 시스템에서는 각 기업이 사용하는 데이터 플랫폼이 다르고, 데이터 형식도 표준화되어 있지 않아 실시간 협업에 많은 어려움이 있음 → 상호운용성을 보장하는 표준화된 데이터 플랫폼을 제공하여 기업들이 원활하게 협력할 수 있도록 지원
- 유럽 공통의 가치를 기반으로 자동차 산업 가치사슬 상 데이터 표준화 및 공유 활성화
- 가치사슬 상 모든 데이터를 공유하기 위한 데이터 스페이스
- 데이터 표준화 및 공유로 자동차 공급망 분야에서 개방 생태계 구축 목표 → 차량-정비사, 차량-부품회사 데이터 공유가 목적
- OEM업체, 자동차 부품 공급 업체(Tier 1, Tier 2, Tier 3)부터 중소기업까지 자동차 산업의 공급망 내에 있는 다수 기업의 참여로 기업들의 회복력 제고 및 신성장동력 창출
농업 분야
개요
- 새로운 혁신적인 농산물 생산 시스템의 필요성
- 세계 인구는 2050년까지 약 97억 명에 이를 것으로 예상 → 식량 수요도 70% 이상 증가할 것으로 판단됨
- 농업 생산성을 높이는 동시에 환경문제와 함께 지속 가능한 농산물 생산량을 확보하는 것이 요구됨
- 기후 변화, 잦은 기상재해, 물 부족, 토양 오염과 비옥도 감소, 농자재 공급망의 안정성 취약 등 다양한 문제사 농업 생산성에 악영향을 미침
- 이러한 문제를 해결하기 위해 빅데이터(Big Data)와 인공지능(AI) 같은 첨단 기술이 농산업 현장에 도입되어, 생산성 혁신의 핵심적 역할을 하고 있음
데이터비즈니스 특징: 정밀 농업과 농업 생산성
- 정밀 농업(Precision Agriculture)
- 농업에서 데이터 기반의 의사결정을 통해 자원을 효율적으로 관리하고 농작물의 생산성을 높이는 것을 목표로 함
- 빅데이터와 AI는 기후, 토양, 농작물 또는 가축의 상태 등 방대한 양의 데이터를 실시간으로 분석 → 작물 재배 또는 사양 관리의 생산 과정을 최적화하기 위하여 농작업 의사결정에 도움을 줌
- 농업에서 빅데이터는 주로 작물 또는 사양 관리, 기후 예측, 농업 생산을 위한 자원 투입 최적화 등에 활용
정밀 농업과 농업 생산성 사례
- 토양의 수분 함량, 작물의 영양 상태, 일사량과 같은 데이터를 실시간 모니터링 → 최적의 관수 개시점 결정, 작물의 증발산량을 계산하여 필요한 수분 공급, 영양상태 분석을 통해 필요한 비료 성분의 적정량을 조정하여 시비
- Bhat and Huang(2021) 연구그룹: IoT(사물인터넷) 기술을 활용하여 센서로부터 데이터 수집 → 분석해 농업 관리에 적용
- 농업 생산성 회복과 탄력성 증대를 위한 프로젝트(유럽과 북미): 위성 이미지와 기후 데이터를 통합 → 작물의 생장 상황을 실시간 모니터링하고 예측하여 농업 생산성을 증대시키고 기후변화에 대응하는 전략 수립
- GATES
- 유럽의 Horizxon 2020 프로젝트
- 정밀농업 기술들로 각종 시뮬레이터들을 만들고 이를 게임으로 운영하는 방식 소개(GIANTS Farming Simulator, 2019)
- 농업 빅데이터들을 활용하여 농사 전략게임으로 프로그램을 개발하고 각종 농기계의 사용 그리고 농작물별 재배, 생산 및 유통에 관한 흥미로운 신산업 창출
- 농업 빅데이터의 수집: 다양한 센서 및 IoT 장치
- 농업 미기상 센서, 토양 수분 센서, 드론(RGB, 초분광, 라이더 카메라 등)을 이용한 데이터 수집
- 라이더와 레이더 차이: 레이더는 전파를 이용해 거리와 속도를 측정, 라이더는 레이저를 이용해 거리와 객체의 정보를 얻음
- 서로 다른 포멧과 구조를 가지므로 이를 효과적으로 통합하고 분석하기 위한 표준화 과정이 필수적
- 데이터의 일관성 있는 관리와 통합은 농업 빅데이터의 성공적인 활용을 위한 중요 요소
농업 빅데이터 활용
- 정보통신기술(ICT)의 급속한 발전과 함께 데이터 기반 스마트 농업으로 빠르게 전환
- 데이터는 작물 재배에서부터 유통, 소비에 이르기까지 농업 전반에 걸쳐 중요한 자원으로 자리잡음
- 농가 생산성 향상 및 기후 변화에 대한 적응력 증대에 기여
- 농촌진흥청: 공공 데이터 개방(2023년)
- 농업 빅데이터 분석/활용 경진대회
- 농업 현장에서 수집된 데이터를 기반으로 문제를 해결하는 창의적인 사례 발굴
- 제주도 주요 소득 작물인 만감류 '레드향' 수확량 감소 요인 분석: 개화와 결실에 관련된 계절 변동성 변수들을 분석해 그 원인을 규명
- 빅데이터를 통해 농가에 환류한 이 분석 결과는 기후, 토양, 생육 조건과 같은 환경 데이터를 기반으로 작물의 생산성에 미치는 영향을 평가하여 농가의 의사결정을 지원함
AI의 농업분야 응용