(이 포스트는 Coursera의 Google Data Analytics Professional Certificate의 강의 내용 일부를 발췌한 학습 요약본입니다.)
<데이터 생애주기 data life cycle>
1. 계획(planning)
2. 수집(capture)
3. 관리(manage)
4. 분석(analyze)
5. 보관(archive)
6. 소멸(destroy)
데이터의 수명 주기는 계획, 수집, 관리, 분석, 보관, 소멸로 이루어져 있습니다.
계획: 이 단계에서 기업은 필요한 데이터와 데이터 수명 주기 동안의 관리 방법, 책임자, 그리고 원하는 결과를 결정합니다. 예를 들어, 전력 공급업체가 에너지 절약을 위해 계획하는 경우, 고객의 전기 사용량, 건물 유형, 그리고 사용되는 기기와 같은 데이터를 수집할 수 있습니다.
수집: 데이터는 다양한 소스로부터 수집되어 조직으로 가져옵니다. 외부 자료원으로부터 데이터를 얻을 수도 있고, 회사 자체 문서와 파일로부터 데이터를 가져올 수도 있습니다.
관리: 이 단계에서는 데이터를 관리하고 저장하는데 중점을 둡니다. 데이터의 보관, 보안, 유지보수 등이 중요하며, 데이터 정제가 이 단계에서 필요합니다.
분석: 데이터 분석가들은 이 단계에서 문제 해결, 의사 결정, 비즈니스 목표 지원 등을 위해 데이터를 활용합니다. 예를 들어, 전력 공급업체가 고객에게 에너지 절약 방법을 찾기 위해 데이터를 분석할 수 있습니다.
보관: 더 이상 활발하게 사용되지 않는 데이터는 보관되어 있지만, 더 이상 주요하게 사용되지 않을 수 있습니다. 보관을 통해 데이터 분석 중에 발생하는 대량의 데이터를 관리하고 정리할 수 있습니다.
소멸: 마지막 단계에서는 더 이상 필요하지 않거나 관련이 없는 데이터를 영구적으로 삭제합니다. 안전한 데이터 소멸 소프트웨어와 분쇄기를 사용하여 기밀 정보와 고객의 개인 정보를 보호합니다.
각 단계는 데이터의 효과적이고 책임 있는 활용을 보장하기 위해 중요한 역할을 수행하며, 데이터의 수명 주기 동안 데이터가 적절하게 활용될 수 있도록 합니다.
각 회사나 산업, 부문에 따라 데이터 수명 주기의 단계는 다양합니다. 미국 어업 및 야생 생태 서비스와 미국 지질 조사국은 역사적 데이터를 중요하게 여기기 때문에 데이터 수명 주기는 보관과 데이터 백업에 초점을 맞춥니다. 하버드 대학의 관심사는 연구와 교육이므로 데이터 수명 주기에는 데이터 분석 수명 주기와 더 자주 연관된 시각화와 해석이 포함되어 있습니다. 하지만 하버드 비즈니스 스쿨(HBS)의 데이터 수명 주기는 데이터를 삭제하는 단계를 따로 명시하지 않습니다. 반면 금융 분야의 데이터 수명 주기는 보관과 삭제 단계를 명확하게 식별합니다.
요약하면, 데이터 수명 주기는 다양할 수 있지만, 데이터 관리 원칙은 보편적으로 적용됩니다. 데이터를 정확하고 안전하며 기관의 요구에 맞게 사용하기 위해 데이터 처리 방식을 관리하세요.
강의 원본: https://www.coursera.org/professional-certificates/google-data-analytics?skipBrowseRedirect=true