[개인프로젝트] 로또 분석 (1) EDA

티나(Tina)·2023년 4월 12일
0

lotto

목록 보기
1/4
post-thumbnail

로또 분석을 해보자

목적

매주 사야하는 번호를 알려주면 좋겠다.

  • 그냥 random 으로 기계가 뽑아주는 것보다는 어떤 연관성을 찾아서 로또 번호를 찍는게 조금이라도 확률이 높아 질 것 같다.
  • 매주 5만원이라도 되면 좋겠다.

목표

  1. EDA
  2. 회귀분석
  3. 자동수집
  4. 배치로 매주 자동 회귀

lotto 분석 github 에 코드 정리하며 진행 예정이다.


EDA

  • 로또 데이터 EDA 해보기(1060회차까지)
    • 지금은 로또 공식 사이트에서 excel 을 다운받았지만, 추후에는 크롤링을 할 예정이다.

각 번호별 평균 구해보기

  • 숫자중 가장 작은 숫자를 a, 두번째 작은 숫자를 b 이런식으로 컬럼명을 명명했다. (임시)

  • 첫번째, 두번째 숫자 말고는 유의미한 변화는 없었다.

각 숫자별 나온 횟수

  • 1~45번 까지 각 숫자들은 여태까지 몇번이나 나왔을까?
count_num = pd.concat([lotto["a"], lotto["b"], lotto["c"], lotto["d"], lotto["e"], lotto["f"]]).value_counts().sort_index()

  • 대략 각 숫자별로 141회정도 나왔다. (1060회차 기준)

  • 시각화 결과로 알 수 있는건, 평균보다 꽤 적게 나오거나 평균보다 꽤 많이 나오는 숫자들이 있다는 것이다.

가장 많이 나온 숫자와 가장 적게 나온 숫자

  • 전체(1060기준)로 봤을때 가장 많이 나옷 숫자
34  :  163번
12  :  156번
18  :  155번
27  :  154번
14  :  152번
17  :  152번
  • 전체(1060기준)로 봤을때 가장 적게 나옷 숫자
9   :  113번
32  :  123번
22  :  124번
23  :  126번
28  :  127번
30  :  128번
  • 최근 100회(1060기준)로 봤을때 가장 많이 나옷 숫자
12  :  19번
29  :  19번
35  :  18번
45  :  18번
14  :  17번
6   :  16번
  • 최근 100회(1060기준)로 봤을때 가장 적게 나옷 숫자
43  :  7번
4   :  8번
10  :  8번
28  :  8번
8   :  9번
19  :  9번

결론

전체와 최근 100회를 기준으로 봤을때,

  • 12,14번은 자주 등장하는 편이다!!
  • 28번은 자주 등잘하지 않는다.

이 숫자들을 기준으로 로또를 구매해 봐야겠다!!

profile
열심히 사는 중

0개의 댓글