TIL10(220915) : 미니 회귀분석 프로젝트
미니 회귀분석 프로젝트
한 일
- 화해 어플의 리뷰 토픽을 기반으로 독립변수를 설정하여, 평점에 영향을 미치는 변수를 찾아보고자 했다.
- 주제를 좁히기 위해 대상은 '토너' 제품으로 한정했다.
- 종속변수(y) : 각 상품의 별점
독립변수(x) : 제형(액상/패드), 흡수력(1~5), 보습력(1~5), 향(1~5), 지속력(1~5)
결과
- 다양한 변수의 조합으로 다중 회귀 분석을 진행했으나, R제곱과 수정 R제곱 모두 0에 수렴하였다. 종속변수에 유의미한 영향을 미치는 변수가 없다고 결론을 내렸다.
- 화장품은 사람마다 취향, 피부타입, 사용 당시의 피부 고민에 따라 만족도가 천차만별일 수 있고, 그렇기 때문에 모든 사용자를 대상으로 회귀분석을 하기에 적절하지 않을 수 있다고 생각이 들었다.
-> 오히려 개별 사용자에 대한 회귀분석이 의미가 있을 것 같다.
아쉬운 것
- 데이터를 만들 때, 어플에서 '랭킹순'으로 설정하고 상위 100개 상품의 정보를 참고해서 만들었다. 수많은 상품 중에 별점이 높은 상품들 위주로만 데이터가 구성되었고, 때문에 상품 간의 별점 차이가 크지 않았다. 이 부분이 결과에 영향을 미쳤을 수도 있을 것 같다.
배운 것
- 10의 8-9은 이번 프로젝트 결과와 같이 유의미한 것을 발견하지 못한다고 한다. 이런 실패(?)의 경험 자체가 의미있었다.
- 데이터 분석을 시도해보거나 주제를 설정하는 데 있어 처음부터 너무 완벽하게 하려고 하지 않아도 된다. 오늘처럼 실생활에서 내 주관적인 평가를 가지고 데이터를 만들어도 된다. 중요한 건 매일매일, '뭘 분석해볼까?' 고민하고 생각해보는 것.