
오늘은 쭈욱 각자가 계속 데이터 분석한 것들에 대해서 정리하고 나누는 시간을 가졌다. 근데 생각보다 우리가 정한 팀과 다른 중위권 팀들의(우리가 정한 팀이 완전 하위권 팀) 유의미한 컬럼값들이 생각보다 차이가 나지 않다는 것을 발견했다.
선수 영입과 방출을 위해서는 우리가 맡은 팀의 강점과 약점을 알아야 할 것이라고 생각했고, 그것을 알기 위해서 다른 팀들과의 비교를 통해 유의미한 인사이트를 도출해내려고 했다. 하지만 그것이 쉽지는 않았고, 계속해서 막혔던 것 같다.
우리의 그런 마음을 알았는지, 튜터님께서 슬랙에다가 데이터분석에서 "무의미한"결과의 가치에 대해서 이야기 해주셨다. 데이터 분석을 하다보면 종종 예상과 다른 결과나 가설과 일치하지 않는 무상관 관계가 나오는 경우가 있다고 한다. 이런 결과를 마주했을 때 실패했다고 느낄 수 있지만, 실제로는 그렇지 않다고 하셨음.
무의미한 결과의 의미는
: 발견의 과정. 가설이 틀린 것을 확인하는 것도 중요한 발견이다. 이것이 다음 단계로 나아갈 수 있는 귀중한 정보이다.
: 편향에서 벗어나기. 항상 의미있는 결과만 찾으려는 것은 확증 편향으로 이어질 수 있다고 한다. 데이터가 말하는 것을 있는 그대로 받아들이는 것이 진정한 데이터과학이라고함.
: 학술적 정직성. 예상과 다른 결과도 정직하게 보고하는 것이 과학적 접근의 핵심이라고 함.
조언해주신 내용은
1. 모든 결과는 배움의 기회이다: 예상과 다른 결과도 귀중한 통찰을 제공한다.
2. 분석 과정 자체에 가치를 두라: 결과뿐 아니라, 우리가 적용한 방법론과 사고 과정도 중요하다.
3. 다른 각도에서 생각해보라: 예상치 못한 결과가 나왔다면, 왜 그런지 더 깊이 탐구해보기. 새로운 가설이나 관점이 떠오를 수 있다.
4. 실패를 두려워하지 말기: 데이터 분석에서 "실패"는 다음 성공으로 가는 징검다리이다.
데이터가 우리의 가설을 지지하지 않더라도, 그 과정에서 배운 것들이 우리를 더 나은 데이터 분석가로 만들어 줄 것이다. 진정한 데이터 과학은 결과의 "의미" 여부보다, 데이터를 정직하게 해석하는데 있다. 그것을 여과없이 결과물로 보여주세요!
한참 계속 뭔가 답이 나오지 않아서 답답하던 차에 튜터님께서 너무 좋은 말씀을 해주셔서 다 적어보고 싶었다. 이번 프로젝트에서도 이런 마음가짐으로 해봐야겠다는 생각이 들고. 안그래도 아까 이야기 하다가 내 머리속에 탁 스쳐지나갔던 생각이-이 난관을 잘 헤쳐나가면 아주 좋은 발표를 할 수 있을 것 같다는- 들었다. 그래서 그걸 우리 팀에도 나누었고, 팀원들이 긍정적마인드. 긍마 라고 이야기해줘서 너무 웃겼다.ㅋㅋ
나의 상태메세지는 그래서 Positive임
암튼 딱 그 이후에 튜터님이 올려주셔서 역시 긍마가 이긴다. 라는 이야기를 또 했다.ㅎㅎ
내가 보았던 데이터는 players 선수들 데이터에서 우리팀에 해당하는 선수들만 가져오고, 그 선수들에서 각 컬럼마다의 상위5명&하위5명을 보는 데이터였다. 이렇게 한 5개 컬럼정도 비교하니 상위보다는 하위에서 겹치는 선수들이 있었는데, 데이터값이 아예0인 선수들이 있었다. 그래서 그 겹치는 하위권 선수들을 방출하려고 했는데, 생각해보니 그 사람들이 아예 경기를 뛰지 않았으니 데이터가 없는거 아닌가 라는 생각이 들었다. 그래서 방출하는 것이 맞는건지 라는 생각이 들음.
-> 한편으로는 있어도 괜찮지 않을까 라는 의견이 있었으나, 어쨌든 방출되는 목적이 팀의 승률을 높이기 위함인데, 그 사람들이 방출된다고 해서 승률이 올라가는 것과 무슨 상관관계가 있는지가 의문이었음.-> 돈의 문제도 있음. 어쨌든 팀에 소속되어있으니 돈이 나가야하니까. 차라리 그 돈을 아껴서 다른 유망한 선수를 데려올 수도 있음.
-> 결국은 팀에 소속되어있지만 한 플레이도 못했다는 것은 그만큼 실력이 없다는 반증이 아닐까 라는 생각이 듬.
-> 방출결정
계속 데이터를 살펴보아도 유의미한 값을 찾을 수가 없었음. 그러다가 시즌마다 선수단을 아예갈아치우는 것을발견함 .그래서도 유의미한 값을 찾을 수 없었으나, 한 팀원분이 말씀해주심. 오히려 그래서 팀의 승률이 더 오르지 않는게 아닐까?-> 인사이트 발견!
현재 팀에 있는 중심적인 플레이어들을 선별해서 그 선수들의 능력치 분석, 그래서 약한 부분을 보충할 수 있는 선수를 영입하는 방향으로 가기로함.
역시 집단지성이 좋다.
-어제도 했는데 오늘도 발생한 에러
:컬럼명은 다 나오는데, 데이터값이 하나도 나오지 않음(행이 아예 없음)->sql에서도 그런적이 있는데, 파이선에서도 그런적이 있음.
그래서 나의 친구 우리의 친구 지피티한테 물어봤는데 그 데이터타입을 잘못설정해서 그럴수 있다고 하였음. 실제로 그 컬럼값이 숫자인데 ''를 붙여버려서 문자타입으로 된거라고.. 아니근데 나 좀 억울한게 나 숫자에다가 ''붙인적 없거든? 근데 자기혼자 붙여져있는거야.. 컴퓨터가 자기혼자 갖다붙였나..?
(설마 이거 어제 TIL에 적었던거 아니겠지,,?)암튼 어제도 틀리고 오늘도 똑같이 틀리는 나란사람.. 이제는 더이상 틀리지 않겠구만..
제발 잘 보자.
화이팅이다!!!