한국 주식을 시작한 지 꽤 되어 가지만 수익이 애매했다. 그래서 몇 몇 아이디어들로 백테스트를 하고, 해당 아이디어 대로 주식 투자를 해보려고 한다.
그래서 코스닥, 코스피 주식의 모든 종목에 대한 시가/종가/저점/고점 데이터를 찾아보려고 했다.
우선 결론부터 말하면, 미국 주식 데이터는 쉽게 구할 수 있으나, 한국 주식 데이터를 구하기는 쉽지가 않았다.
이번 백테스트 목표는 한국 주식 시장이었기 때문에 한국 주식 투자 데이터를 수집해보고자 한다.
검색을 해보면 네이버를 크롤링 하는 방식이 많이 나와있는데, 모든 주식 데이터를 가지고 와야 하기 때문에 크롤링으로는 시간이 너무 오래 걸릴 것 같았고, api를 찾아보기로 했다.
우선은 한국에 있는 주식 종목 코드를 찾아보자.
이 페이지로 들어가서 엑셀 다운로드를 하면 완료!
데이터 처리를 용이하기 위해서 csv 파일로 파일을 변환했다.
혹시 한국 주식 종목 csv 파일이 필요하신 분은 이 링크를 통해 받을 수 있다(2020년 9월 18일 데이터)
20190918상장법인목록
https://towardsdatascience.com/best-5-free-stock-market-apis-in-2019-ad91dddec984?gi=ebcc1ed2a104
위의 블로그 글을 보고 하나씩 따라 해봤는데, 결론은 api 제공 서비스를 통해서 한국 주식 데이터를 무료로 사용할 방법이 없다는 것이다.
야후 finance api가 막혔다고 생각하는 사람이 많은데, 몇 년 전에 다시 오픈을 했다.
야후 finance api를 가지고 오려면 yfinance라는 python package가 존재해서 쉽게 데이터 수집을 할 수 있었다.
하지만 yfinance 데이터는 큰 회사의 주식 데이터(삼성, SK하이닉스 등)만 제공하고, 작은 회사의 주식 데이터는 최근 하루의 데이터와 2018년 데이터 이전의 데이터만 제공한다.
(2018년 2월부터 어제까지의 데이터가 없다)
나는 한국 모든 주식 정보에 대해 알고 싶기 때문에 yahoo finance를 선택할 수 없다.
아는 분들은 아시겠지만, 구글 주식 api는 이미 예전에 막혔다. 하지만, 구글 스프레드 시트를 활용해서 주식을 확인할 수 있는 방법이 있다. 자세한 부분은 이 링크를 참고하는 것이 좋을 듯 하다.
구글 스프레드시트를 파싱해서 쓰기에는 무리가 있는 듯 하여 이 방법도 패쓰!
website : https://iexcloud.io/
the basic free trial, you already get 500,000 core message free for each month.
iexcloud는 core message를 무료로 500,000개나 지원한다고 하고, 찾아보니 python package도 제공한다!
엄청 좋다!라고 생각을 했으나, 무료 계정에서는 historical_data를 제공하지 않는다.
데이터 분석을 위해서 코드도 다 짰는데, 무료 계정에서 히스토리컬 데이터를 제공하지 않아서 이것도 패쓰...
website : https://marketstack.com/
블로그 글에는 worldtradingdata라고 되어 있지만, marketstack으로 이름이 변경된 것 같다.
무료 계정은 1년 간 데이터를 한 달에 1000번 api 요청까지 가능하다. REST api로 제공하기 때문에 데이터 처리도 쉬웠다.
한국 주식 중에서는 약 1700개의 기업에 대한 주식 데이터를 제공하고 있다.
여러 서비스를 검토해봤는데, 무료로는 마땅한 방법이 보이지 않아서 결국에는 Marketstack 유료 계정으로 사용하기로 했다.
간단하게 데이터 처리가 필요하신 분이 계실 것 같아서, 한국 주식 데이터를 1년 간 수집한 데이터를 첨부한다.
1년 데이터로도 충분히 많은 테스트를 할 수 있을 것으로 보인다.
본인은 10년 간의 데이터로 백테스트를 하고 있는데, 혹시 10년 간 데이터가 필요하시다면 tonymetricstudio@gmail.com 으로 메일을 주시면, 커피값 정도로 제공을 해드리고자 합니다
좋은 내용 감사합니다 멋지네요! 저도 금융 개발 공부하는 중인데, https://quantpro.co.kr/ 해당 사이트 퀀트 내용 어떤지 의견주시면 감사하겠습니다!
혹시 분봉데이터도 수집중이신지요?