개발 노베이스 데이터분석가가 추천하는 <실무자를 위한 그래프 데이터 활용법>

Haein Kim·2022년 5월 29일
1

한빛미디어 서평

목록 보기
12/14
post-thumbnail

실무자를 위한 그래프 데이터 활용법 / 데니즈 고즈넬, 마티아스 브뢰헬러 지음 / 한빛미디어

그래프를 그리면 세상이 보인다,
그래프 씽킹으로 시작하는
그래프 데이터베이스 사용 안내서

저는 데이터 엔지니어가 아닌데요?

네, 저도 그렇습니다. 개발 베이스가 없는 순수(?) 데이터분석가 입니다. 그럼에도 이 책을 고른 이유는, 아래의 문장에서 나옵니다.

컴퓨터는 행과 열로 이루어진 정적 데이터에 의존하는 반면, 사람은 관계를 통해 삶을 탐색하고 유추한다.
그래프 데이터는 사람과 컴퓨터가 세상을 바라보는 관점의 차이를 좁힌다.

첫째, 철학적으로도 공감하는 문장이지만, 실무에서 커뮤니케이션 할 때, 거의 항상 "테이블 이외의 형태"를 가지고 합니다. 다들 한 번쯤 말로 부족해서 화이트보드에 그리면서 설명해본 경험이 있으실 겁니다. 재밌있게도, "이게 무슨 말인지 모르겠다면, 아이러니 하게도 그게 바로 그래프 데이터가 필요한 이유"라는 얘기도 나온답니다.

둘째, 필자들도 말하고 있듯, 기존에는 '가장 효율적으로 저장'하는 방법에 집중해왔다면, 이제는 데이터에서 '가장 중요한 가치'를 얻는 것이 중요합니다. 저희 팀장님도 늘 "비용 신경쓰지 마세요!" 라고 하시거든요. 그보다 의미있게 데이터를 활용할 수 있도록 데이터마트나 대시보드를 구성하는게 실무에서도 매우 중요합니다.

실무에서 은연중에 쓰고 있던 기술을 이론적으로 이해하고 좀 더 고도화할 수 있지 않을까 하는 기대로 이 책은 펼쳤습니다.

그래프 씽킹: 복잡한 관계에서 가치 얻기

정보의 조각들을 서로 연결하고 새로운 통찰을 만들었을 때 데이터에서 가치를 추출할 수 있다.
데이터에서 유의미한 가치를 추출하기 전, 먼저 데이터 안의 복잡한 관계부터 이해해야 한다.
즉, 데이터 관계에서 발생하는 복잡한 문제와 시스템을 이해한다는 의미다.

실무에서 진짜 의미있는 분석은 "이번 주 유저 수"와 같은 단순한 지표에서 나오지 않습니다. 유저의 행동 로그든, 구매 데이터든, 복잡한 문제와 거기서 발견하는 패턴 속에서 가치가 높은 비즈니스 문제가 나오지요. 그리고 필자들은 그래프 기술로 이를 해결한다고 합니다.

이러한 방식의 데이터가 실제로도 얼마나 가치가 있는지도 예시를 듭니다. 마이크로소프트가 링크드인과 깃허브를 예상수익의 20배 넘게 인수한 것으로요. 둘 다 '네트워킹'을 크고 복잡한 문제로 정의하고 솔루션을 모델링한 데이터를 가진 회사죠.

이론부터 실전까지

데이터에서 가치를 얻으려면 이들의 상호 연결 관계를 살펴야 한다.
즉 데이터가 묘사하는 복잡한 시스템을 파악해야 한다.
그 후에 이런 연결을 저장, 관리, 추출하는 적절한 기술을 선택해야 한다.

이 책은 데이터와 함께 개념, 예제, 새로운 용어를 설명합니다. "실무자를 위한"이라는 책의 제목 답게 말이죠. 주석이 충실하게 달린 예제 코드가 달려있어서, 따라해보기도 쉽습니다. (참고: 그렘린 쿼리데이터스택스 그래프 스키마 API 사용)

그래프 이미지도 매우 충실하게 사용되고 있어서, 직접 코딩을 하지 않더라도 이론과 케이스를 이해하는 데에도 충분합니다. 시스템 구축을 엔지니어에게 맡긴다고 하더라도, 결국 데이터의 관계를 파악하고 비즈니스 문제를 정의, 해결하는 건 분석가 내지 프로덕트 관계자가 하는 일이니까요.

최신 기술 내지 이론인 만큼 잘 정리된 자료가 많이 없는데요. 저처럼 그래프 데이터를 처음 접하는 분이든, 이미 경험했던 분이든 추천하는 책입니다.

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

profile
콘텐츠를 사랑하는 데이터 분석가

0개의 댓글