TIL - Day 47

김혁·2023년 12월 8일
0

2차 프로젝트

imdb 데이터 분석
title.basics.csv (데이터 개수 10371207개)
tconst
작품을 나누는 primary key
titleType 종류 (11개)
short
movie
tvShort
tvMovie
tvSeries
tvEpisode
tvMiniSeries
tvSpecial
video
videoGame
tvPilot
isAdult 값

  • 0,1 말고 2019, 1981, NULL 값들이 있습니다

genres

  • 레코드에 , 로 구분된 장르들이 들어있습니다
    , 로 나누어서 어떤 값들이 있는지 확인해야 볼 필요가 있습니다

startYear

  • 2030까지 있는 것을 보니 아직 개봉 전의 작품들도 포함한 것으로 보입니다

startYear, endYear, runtimeMinutes

  • null 값이 존재합니다

title.akas.csv (데이터 개수 38007585개)
titleId
title.basics의 tconst
ordering

  • 같은 영화 구분하기 위한 numbering

title

  • 나라별로 해당 언어로 되어 있음

TEXT 타입 넘을 정도로 긴 데이터 존재
region - 나라
language - 언어
name.basics.csv (데이터 개수 13062203개)

primaryName - 영어, 다른 나라 언어 섞여 있습니다
birthYear, deathYear -null 값 있습니다
primaryProfession

  • , 나누어서 확인해 봐야 합니다
    감독, 배우, 음악감독 등 이 있습니다

knownForTitles

  • 3개 이상의 값도 존재합니다

대시보드

국가별 영상 종류 pie chart
국가마다 영화, 드라마, 다큐멘터리와 같이 많이 만드는 영상이 다를 것 같아서 생각해 봤습니다
한국은 드라마를 많이 만들 것 같고, 예술 영화는 프랑스가 많이 만들 것 같습니다
해당 정보를 파악하고 있으면 나라별 트렌드를 알 수 있을 것 같아서 생각해 봤습니다
국가별 영상 순위
국가의 영화나 드라마 순위를 알아보는 것이 의미 있을 것 같습니다
작업자 pie chart
국가에 어떤 영상 작업자가 많은지 파악할 수 있을 것 같습니다
작업자 종류로 나누어서 순위
배우나 감독의 경우 어떤 사람이 작품을 많이 하는지 알면 유의미한 정보가 될 수 있을 것 같습니다

profile
군도리

0개의 댓글