데이터 관련 이슈

넘어산·2023년 11월 24일
0

TIL

목록 보기
2/37

관련 이슈

  • 무분별한 개인 정보 전파
  • 같은 데이터, 다른 해석
  • 너무 많은 대시보드와 비슷한 테이블
  • 불분명한 데이터 오너십
  • 등등....

같은 데이터, 다른 해석

지표 등의 정확한 정의 필요

너무 많은 대시보드와 비슷한 테이블

비슷하거나 너무 많으면 어디 대시보드 봐야할 지 고민이다
그래서 Data Catalog를 도입한다(=Data Discovery)

메타 데이터의 부족

누가 주인이며 어떻게 생성된 데이터인 지 알 수 없다
중요 데이터별로 오너 지정
데이터별로 다양한 분류 체계를 적용해야 한다

불필요한 데이터 오너십

데이터 양의 증가는 데이터 품질 이슈로 이어진다

Data Silo 발생

비슷한 일을 여러 팀에서 반복
동일 데이터를 여러 조직에서 중복 수집하고 처리
조직 전반에 걸친 메타 데이터 관리/유지


개인정보란?

개인 식별 정보란 PI(Personal Identification)
주민등록번호, 이메일, id 등..

개인정보 보호

  • 개인정보를 적절한 동의업이 저장하고 사용하지 않는 것
  • 외부로부터 보호하는 것보다, 동의와 배포로 더 나아간다

개인정보 보호법

  • GDPR
  • 유럽연합 내 모든 회원국에 적용
  • EU 사용자가 있는 웹서비스의 경우 모두 적용대상
  • 데이터 카탈로그, 데이터 거버넌스

GDPR 세부사항

  • 삭제권: 정보 삭제 요구 권리
  • 프로파일링 거부권: 자동화된 처리에 의해서만 결정 반대
  • 처리제한권: 처리 차단 및 제한 요구 권리
  • 정보이동권: 정보를 다른 사업자에게 전송토록 요구할 권리

0개의 댓글