스파르타 코딩클럽은 Slack을 사용해 스터디 그룹을 관리한다. 매주 정해진 요일마다 진행하는 온라인 스터디 공지와 질의응답 등을 위해 사용한다고 한다.
평소 OneNote를 사용하고 있기 때문에 온라인 개발일지를 제대로 사용해본 적이 없다. 강의에서 티스토리, 미디엄, 벨로그 등 개발일지를 작성해보라는 말을 듣고 이 참에 시작해보기로 했다. 이 세 가지 외에도 Github 블로그, 브런치, 노션 등 여러 가지 플랫폼을 찾아봤지만 벨로그가 Markdown 문법을 사용하며, 코드 첨부가 용이하다고 해서 더 고민하지 않고 벨로그를 선택했다.
분석 목적 및 데이터의 특징에 따라 분석 방법 선택
통계
AI
Autoregressive Integrated Moving Average(ARIMA)
Correlation(Linear Regression Model) + Cointegration(Trend)
ARIMA 모형의 한계와 ML/DL의 필요
ARIMA모형으로 분석하기 어려운 경우, 머신러닝 혹은 딥러닝 모형의 구현을 고려.
상황이나 데이터의 특성에 의해 ARIMA모형으로 분석하기 어려운 경우, 머신러닝 혹은 딥러닝 모형의 구현을 고려.
Q: 각 매장의 개별 상품들에 대한 판매량 예측
데이터: 3년간의 판매 데이터
Simple Linear 모형: Linear하지 않은 데이터를 Linear 모형에 적용.
평균 판매량 예측 가능 - 정확한 판매량 예측 불가.
LSTM 모형: 매출의 트렌드 흐름 학습
Non-Linear한 Trend Line을 찾아서 판매량 예측 가능.
MLP의 기본 구성
"시간", "순서" 개념이 들어간 딥러닝의 가장 기초 모형
지금의 순간을(t) 그 전 순간(t-1)을 바탕으로 (Context) 이해.
스스로를 반복하면서 이전 단계에서 얻은 정보가 지속적으로 기억되게함
Sequence 길이의 제한이 없기 때문에 one-to-one 뿐만 아니라 one-to-many, many-to-one, many-to-many도 가능
나무보다 숲을 봐야하는 경우에 취약함: chain이 반복될수록 최근 학습한 내용은 잘 기억하는 반면 앞서 학습했던 내용은 잘 기억하지 못하기 때문.
블로그 게시글 분석 <<< 10글자 리뷰 분석
문맥 상 의미 추론 <<< 단어 분석
현재시점의 input: x
예측값: y
예측 시점: t
이전 chain의 결과값: h
bias: b