로또 분석을 해보자
목적
매주 사야하는 번호를 알려주면 좋겠다.
- 그냥 random 으로 기계가 뽑아주는 것보다는 어떤 연관성을 찾아서 로또 번호를 찍는게 조금이라도 확률이 높아 질 것 같다.
- 매주 5만원이라도 되면 좋겠다.
목표
- EDA
- 회귀분석
- 자동수집
- 배치로 매주 자동 회귀
깃
lotto 분석 github 에 코드 정리하며 진행 예정이다.
EDA
- 로또 데이터 EDA 해보기(1060회차까지)
- 지금은 로또 공식 사이트에서 excel 을 다운받았지만, 추후에는 크롤링을 할 예정이다.
각 번호별 평균 구해보기
- 숫자중 가장 작은 숫자를 a, 두번째 작은 숫자를 b 이런식으로 컬럼명을 명명했다. (임시)



- 첫번째, 두번째 숫자 말고는 유의미한 변화는 없었다.
각 숫자별 나온 횟수
- 1~45번 까지 각 숫자들은 여태까지 몇번이나 나왔을까?
count_num = pd.concat([lotto["a"], lotto["b"], lotto["c"], lotto["d"], lotto["e"], lotto["f"]]).value_counts().sort_index()

- 대략 각 숫자별로 141회정도 나왔다. (1060회차 기준)

- 시각화 결과로 알 수 있는건, 평균보다 꽤 적게 나오거나 평균보다 꽤 많이 나오는 숫자들이 있다는 것이다.
가장 많이 나온 숫자와 가장 적게 나온 숫자
- 전체(1060기준)로 봤을때 가장 많이 나옷 숫자
34 : 163번
12 : 156번
18 : 155번
27 : 154번
14 : 152번
17 : 152번
- 전체(1060기준)로 봤을때 가장 적게 나옷 숫자
9 : 113번
32 : 123번
22 : 124번
23 : 126번
28 : 127번
30 : 128번
- 최근 100회(1060기준)로 봤을때 가장 많이 나옷 숫자
12 : 19번
29 : 19번
35 : 18번
45 : 18번
14 : 17번
6 : 16번
- 최근 100회(1060기준)로 봤을때 가장 적게 나옷 숫자
43 : 7번
4 : 8번
10 : 8번
28 : 8번
8 : 9번
19 : 9번
결론
전체와 최근 100회를 기준으로 봤을때,
- 12,14번은 자주 등장하는 편이다!!
- 28번은 자주 등잘하지 않는다.
이 숫자들을 기준으로 로또를 구매해 봐야겠다!!