마이크로소프트에서 개발한 알고리즘으로, GoogleLeNet은 22개 층으로 구성됐지만, 7배 깊은 층, 152개를 사용하여 깊은 네트워크를 사용한 층을 갖는다.단순히 네트워크 깊이만 깊어지면 성능이 좋아질까?ResNet의 논문에는 56층의 네트워크가 20층의 네트워크
RDBMS가 Analytic SQL을 사용하게 됨으로써 다시 데이터 분석의 중심이 될 수 있던 기능이다. 기존 Group by 함수는 원본 데이터 집합의 레벨을 변경하여 적용함에 비해, Analytic SQL은 원본 데이터 집합의 레벨을 그대로 유지하면서 집계 함수를
hiredate는 입사일의 데이터인 Date타입이다. 여기에서 입사년도. 즉 1981이란 년도만 추출하고 싶으면 다음과 같이 한다.그렇다면 다음과 같이 문자열 형식으로 추출할 수 있다.Cases When은 조건에 따라서 값을 지정해 주는 문법이다.CASE 문의 형식은
대표적인 집계함수 종류Count(): 정해진 집합 레벨에서 데이터 건수를 계산Sum(컬럼): 정해진 집합 레벨에서 지정된 컬럼값의 총합을 계산Min(컬럼): 정해진 집합 레벨에서 지정된 컬럼값의 최솟값을 계산Max(컬럼): 정해진 집합 레벨에서 지정된 컬럼값의 최댓값을
만약 다음과 같은 테이블이 있다 한다.직원들의 부서별 급여의 합을 구하려면 Group by 기능을 사용한다.Group by 절에 기술된 컬럼 값(또는 가공 컬럼값)으로 그룹화 한 뒤 집계(Aggregation) 함수와 함께 사용되어 그룹화된 집계 정보를 제공한다.Gro
Date: 일자로서 년, 월, 일의 정보를 가짐. YYYY-MM-DDTimestamp: 일자를 시간 정보까지 같이 가짐. YYYY-MM-DD HH24:MI:SSTime: 오직 시간 정보만 가짐. HH24:MI:SSInterval: N days HH24:MI_SS =>
지난 글에서는 Join에 대하여 배웠다. Join의 디폴트는 Inner Join이다.즉 on에 붙어있는 조건에 해당해야만 새로운 데이터로 추출하는 형식이다.만약 다음과 같은 코드가 있다 하자.다음은 categories 테이블의 category_id와 products
SQL의 기본 문법은 다음 글 참조. 글join은 관계형 DB에서 기본이자 가장 중요한 기능이다.두 개 이상의 테이블을 묶어 데이터를 추출하는 기능.관계형 DB에서 join을 이용하여 서로 다른 테이블 간의 원하는 정보를 얻을 수 있음.emp 테이블: 직원의 이름, 직
Database란? > 데이터베이스(영어: database, DB)는 여러 사람이 공유하여 사용할 목적으로 체계화해 통합, 관리하는 데이터의 집합이다. 작성된 목록으로써 여러 응용 시스템들의 통합된 정보들을 저장하여 운영할 수 있는 공용 데이터들의 묶음이다. - Wi
select는 데이터를 조회하거나 산술식, 함수 등을 실행할 때 사용된다. SQL은 대소문자를 가리지 않지만, 구문에 해당되는 것은 대문자로만 적는다.\*(에스터리스크, 별표)는 모든 항목을 다 출력할 때 사용함.여기서 원하는 컬럼만 출력하고 싶을 때에는 아래와 같이
패션 MNIST 데이터 불러온 후, 스케일링 후 Train, Validation Set으로 분할최종적으로 만들어지는 피처맵의 크기는 (7, 7, 64)model.summary()keras.utils.plot_model(model)model.compile(optimize
합성곱 신경망(CNN)은 Convolution Neural Networks의 줄임말로, 인간의 시신경을 모방하여 만든 딥러닝 구조 중 하나이다. 이미지 처리에 탁월하며, ANN, DNN과 다르게 이미지의 공간적인 정보를 유지한다.먼저 다음과 같은 3x3의 이미지가 있다
이전 챕터와 마찬가지로 데이터 불러온 후 전처리하기.모델을 생성 후 반환하는 함수 만들기모델 생성 후 학습시키기.다음 그래프와 같이 epoch가 증가할 수록 손실은 줄어들고 정확도는 높아진다. 그러면 epoch를 계속해서 증가하면 성능이 완전히 올라가지 않을까?다음은
케라스 API의 패션 MNIST 데이터셋을 불러오자.그 다음 이미지의 픽셀값을 0~255범위에서 0~1로 변환 후, 28\*28 크기의 이미지를 1차원 배열로 평탄화한다. 후에 sklearn의 train_test_split() 메서드를 사용해 train과 validat
다음 코드로 텐서플로의 데이터를 불러온다.데이터의 크기를 확인한다.위의 train 데이터는 2828의 픽셀로 되어있는 이미지가 총 6만개가 있고, test 데이터는 2828 픽셀로 되어있는 이미지가 총 10000개가 있다는 뜻이다.다음은 10개의 데이터만 이미지로 출력
Support Vector Machie은 Classfier에서 사용할 수 있는 강력한 머신러닝 모델이다.Support Vector Machie(SVM)은 결정 경계(Decision Boundary)를 정의하는 모델이다.다음 군집을 이루고 있는 데이터의 결정 경계는 다음
MFCC(Mel Frequency Cepstral Coefficients)란 음성 및 오디오 신호 처리에서 대표적으로 사용하는 기술이다. MFCC는 음성데이터를 특징백터화해주는 Algorithm이다.사람은 음성을 인식할 때 달팽이관에서 각기 다른 주ㅜ파수를 감지한다.
다른 환경에서 작업을 하거나, 다른 사람과 협업을 할 때 변경사항이 생기면 매 번 시작전에 Pull을 통하여 변경사항을 업데이트해야 한다. 하지만 매번 Pull을 해야 하는 것이 너무 번거롭다. 애초에 작업공간을 나눠서 하면 어떨까? 이것을 위한 것이 Branch이다.
과일 사진 이벤트를 위하여 고객들이 보낸 여러 개의 이미지를 받아 k-평균 알고리즘으로 분류 후 폴더별로 저장한다. 그런데 너무 많은 사진이 등록되어 저장 공간이 부족하다. 나중에 군집이나 분류에 영향을 끼치지 않으면서 업로드된 사진의 용량을 줄일 수 있을까?지금까지
지난 글지난 글에서는 사과, 파인애플, 바나나에 있는 각 픽셀의 평균값을 구해서 가장 가까운 사진을 골랐다. 이 경우에는 사과, 파인애플, 바나나 사진임을 미리 알고 있었기 때문에 각 과일의 평균을 구할 수 있었다. 하지만 진짜 비지도 학습에서는 사진에 어떤 과일이 들