역시 두뇌 회전, 사고력 연습에는 파이썬만한게 없는 것 같다.파이썬에서 Map(), Zip() 함수는 매우 많은 용처를 갖고 있다. Map()의 경우에는 특정 데이터에 대해 연산을 깔끔하게 시켜주고 싶을 때, Zip()의 경우에는 배열을 2차원으로 구성해내고 싶을때 쓸
(The Korean Journal of Economics Vol. 26, No. 2 (Autumn 2019) )작년부터 관심있게 봤던 논문인데 아직 한번도 제대로 본 적이 없어서 쉬어가는 타이밍에 ML 관련 내용을 정리해보고자 한다 !본 논문은 경제학 전공자를 대상으
Redshift는 Athena와는 달리, 비정형 데이터 구조(주로 Json과 같은 key-value 구조)를 저장할 수 있도록 하는 super type 컬럼을 제공하고 있다.관련 내용 : https://docs.aws.amazon.com/redshift/lat
본 포스팅은 기업재무론(Corporate Finance)에서 배우는 CAPM(Capital Asset Pricing Model)을 통계학에서의 선형회귀모델(Linear Statiscal Model)과 연관지어 학습하고자 정리한 시리즈 포스팅입니다 :)CAPM은 간단히
내가 원하는 연산$\\vec x := (x_1, ...\\,, x_n) \\in \\R^n,\\,\\,k \\in \\R$ 일때,아주 간단한 연산인 $k\\cdot\\vec x \\in \\R^n$ 를 구현하고자 하는 것ㄷㄷ..고차원 벡터, 행렬연산에서 numpy가 얼
통계학에는 크게 확률 변수의 값이 이산적인지, 연속적인지의 여부에 따라 이산형 확률 변수(Discrete Random Variable), 연속형 확률 변수(Continuous Random Variable)로 구분한다. 다시 말해서, 특정 random variable의
선형 배열은 데이터들이 선 (line) 처럼 일렬로 늘어선 형태를 말합니다. 보통 프로그래밍에서 배열 (array) 이라고 하면 같은 종류의 데이터가 줄지어 늘어서 있는 것을 뜻하는데요, Python 에서는 서로 다른 종류의 데이터 또한 줄세울 수 있는 리스트
회귀 문제(Regression) 분류 문제(Classification)The main difference between Regression and Classification algorithms is that Regression algorithms are used to
$0^{th}$ order tensor example : $1, -0.2, \\,...$$1^{st}$ order tensorexample : $v=0.1, 0.7, -0.2$속도나 물리적인 힘처럼 "방향"이 있는 것Zero Vector (null vector) : v
np.random.randint() : 균일 분포의 정수 난수 생성np.random.rand() : 0부터 1사이의 균일 분포의 난수 matrix array 생성np.random.randn() : 표준 정규 분포에서의 난수 생성 (평균 0, 표준편차=1)위 numpy.
우선, 분산이라는 것은 특정 데이터(확률 변수)가 평균으로부터 얼마나 흩어져있는지를 강조하여 나타내는 지표이다. 분산의 수학적 정의는 다음과 같다.$Var(X)\\,=\\,E(X-\\mu)^2\\,=\\,E(X^2)-E(X)^2$앞서 말한 것처럼, 확률 변수 $X$가
$f(x)=e^x$$f'(x)=e^x$$f(x)=e^{g(x)}$$f(x)=e^{g(x)}·g'(x)$$f(x)=a^x\\,\\, (where\\,\\, a ∈ R,\\, a>0, a≠1)$$f'(x)=a^x·ln\\,a$$f(x)=a^{g(x)}\\,\\, (wher
얼마전 DP에도 나온 몬티홀 문제! 개인적으로 준비하는 시험이 있어서 확률론 공부도 할겸 재미삼아 모범 답안을 필사해보았습니다. 본 문제는 서울대학교 산업공학과 대학원 입시 샘플 테스트 문제 중 통계학(확률론) 문제에 해당합니다.플레이어는 게임의 참가자와 호스트 총 2
$Common\\,Shareholders'\\,Equity\\,/\\,Market\\,Cap$$Price\\,per\\,Share\\,/EPS=Market\\,Cap\\,/Net\\,Income$$Price\\,per\\,Share\\,/\\,BPS=Market\\,C
RNN 기반의 LSTM 모델을 사용하여 시계열 분석을 진행하기 전에, 시계열 데이터를 예측하는 전통적인 머신러닝 방법론인 ARIMA 모델을 활용하여 다양한 경제/금융 변수들의 데이터 추이를 예측하는 것을 목표로 함FRED, 한국은행의 경제통계 DB를 통해 7가지 변수(
원문 : 비전공자를 위한 통계방법론 (양혁승) 제 3장. 추리통계 (통계적추론) 제 1절. 통계적 추론의 기본 개념 1. 통계적 추론 (Statiscal Inference) 모집단에서 추출한 표본으로부터 얻은 자료에 근거하여 모집단에 대한 특성을 추정하는 과정을 통계
오늘 작성할 글은 JVM 코어 구조와 관련된 내용이다. 코딩 자체와는 큰 상관은 없어보이지만 저장 구조를 이해하는 것도 재밌는 일이니 한번 써보려고 한다.
본 문서에서는 SQL 기본 문법만 가지고도 구글 빅쿼리, 데이터 스튜디오를 활용해 데이터 웨어하우스와 기본 쿼리를 알아봅니다. 구글 빅쿼리 화면 구성 알아보기쿼리 관련 여러가지 예제