2023 그린스타트업타운 창의인재양성 아카데미
INNOST Digital Academy 빅데이터 과정
최근, 기존 데이터와는 비교할 수 없을 정도로 크고 다양한 자료가 빠르게 생성되고 있다.
이러한 데이터를 빅데이터라고 한다.
빅데이터는 데이터를 분석, 이해할 수 있는 정도에 따라 빅데이터의 가치가 측정된다.
데이터의 패턴을 파악해 의미를 도출하고 미래를 예측하여 유리한 의사 결정을 하기 위한 일련의 과정
데이터 분석은 다양한 분야에서 문제를 빠르게 파악하고, 더 나은 결정을 내리는데 도움을 준다.
데이터 분석의 목적은 더 나은 의사를 결정하는 것이다.
Google의 경우를 예로 들어보자.
구글에는 수 많은 문서가 있다.
관리자는 많은 문서들 중 사용자의 검색 의도에 가장 부합하는 문서를 위에 배치하고 나머지는 순차적으로 배치해야 한다.
이때, 사용자의 검색 의도와 부합하는 문서는 무엇인지 어떻게 알 수 있을까?
문서에서 사람이 머무는 지속 시간을 보는 것!
선택한 문서가 만족스럽지 못한다면 사용자는 다시 검색 결과로 돌아와 다음 순위 문서를 클릭한다.
즉, 사용자가 뒤로 가기 버튼 클릭의 유무로 해당 문서가 검색 의도를 충족시켰는지 판단할 수 있는 것이다.
데이터 마이닝은 대용량의 데이터에서 유용한 정보를 찾아내고, 이를 패턴이나 규칙 등으로 표현하는 과정이다.
데이터 마이닝에서 찾아진 패턴은 구글의 향후 검색 결과를 개선하고 사용자의 검색 경험을 향상시킨다.
관찰한 데이터에 있는 패턴이나 관계를 수학적인 표현으로 재해석하여 수식으로 표현하는 작업이다.
복잡한 현실 세계의 현상을 단순화하고 일반화하여 이해하고 예측하는데 중요한 도구이다.