profile
hello world :)
post-thumbnail

서버 배포하기 Step by Step

AWS를 이용해 Flask앱을 배포하는 과정의 기록입니다. 1. AWS에 계정을 만들고 인스턴스를 생성해줍니다. 사용할 리눅스 버전은 Ubuntu 20.04입니다. 우분투의 버전은 여러가지가 있는데, 정식출시 "연도.월" 식으로 되어있습니다. 20.04 버전의 경우

2021년 10월 28일
·
0개의 댓글

정렬 알고리즘

종류분석시간복잡도stable

2021년 10월 25일
·
0개의 댓글

[DE] RDB, RDBMS

RDB(Relational DataBase)란 관계형 데이터 모델에 기초를 둔 데이터베이스로 모든 데이터를 2차원의 테이블 형태로 표현합니다.

2021년 9월 15일
·
0개의 댓글

[DE] DB Indexing

작성중입니다

2021년 9월 9일
·
0개의 댓글

[DE] Batch 작업, OLTP, OLAP

빅 데이터 처리는 실시간으로 할 수도 있고, 특정시간에 일괄적으로 처리할 수도 있습니다.

2021년 9월 8일
·
0개의 댓글

[DE] AB Test

AB Test란 실 사용자를 대상으로 대조군 (Control Group)과 실험군 (Experimental Group)으로 나눠서 특정한 UI나 알고리즘의 효과를 비교하는 방법론입니다.

2021년 9월 6일
·
0개의 댓글

[DE] Funnel 분석, Cohort 분석

Funnel(깔때기) 분석과 Cohort(공통집단) 분석은 서비스에 대해 분석하는 기법들 입니다.

2021년 9월 6일
·
0개의 댓글

[DE] Hadoop Eco-system

하둡의 많은 서브 프로젝트들에 대해 전반적으로 알아보겠습니다.

2021년 9월 1일
·
0개의 댓글

[DE] Hadoop (MapReduce)

대용량의 데이터 처리를 위한 분산 처리 프레임워크입니다. MapReduce 프레임워크를 이용하면 대량의 데이터를 병렬로 분석 가능합니다.

2021년 9월 1일
·
0개의 댓글

[DE] Hadoop (HDFS)

빅데이터 관련 포스팅을 보면 대부분 하둡 에코시스템(Hadoop eco-system)을 사용하는것을 볼 수 있습니다. Hadoop에 대해 알아보도록 하겠습니다.

2021년 8월 29일
·
0개의 댓글

[DE] DB Transaction

Transaction에 대해 알아보았습니다.

2021년 8월 28일
·
0개의 댓글

[DE] 빅데이터 저장소(Data Storage)

Data Warehouse(데이터 웨어하우스), Data Lake(데이터 레이크)에 대해 알아보았습니다.

2021년 8월 28일
·
0개의 댓글

[DE] 빅데이터의 특징(3V, 5V, 7V)

빅데이터의 가치를 판단하는 7가지 기준에 대해 알아봤습니다.

2021년 8월 27일
·
0개의 댓글

[DE] ETL 이란?

데이터 처리 관련하여 검색을 하다보면, ETL이라는 용어를 자주 볼 수 있습니다. 단어 자체를 풀이하자면 추출(Extract), 변환(Transform), 적재(Load)인데 정확히 어떤 개념인지 명확하게 떠오르지 않을 수 있습니다.

2021년 8월 26일
·
0개의 댓글

[Data Engineering] 데이터 엔지니어링

기업들의 기술블로그들을 살펴보다 보면 아래와 같은 Data flow를 볼 수 있습니다.(출처: 토스 SLASH2021 )좀 복잡해 보이지만 앞으로 글을 작성하면서 하나하나 알아보려고 합니다.그 전에, Data engineering이란 무엇일까요?검색해 보니 유사한 직무

2021년 8월 26일
·
0개의 댓글

Batch size는 크면좋을까 작으면 좋을까?

딥러닝 논문을 살펴보다 보면 batch size를 256정도로 주는 논문이 많습니다. 그러면 이 batch size를 크게할수록 좋을까요 작게할수록 좋을까요??딥러닝의 학습안정화가 잘 안되던 예전에는 batch size를 작게하는게 의외의 효과를 불러왔습니다. batc

2021년 8월 12일
·
0개의 댓글
post-thumbnail

왜 CNN kernel은 odd size 일까?

CNN 모델들을 보면 kernel size가 1x1, 3x3, 5x5, 7x7..등 홀수 사이즈가 대부분 입니다. (kernel size = 2, stride = 2인 pooling의 경우 연산이 비슷하지만 CNN kernel이 아니라 학습할 parameter가 없는

2021년 8월 12일
·
0개의 댓글

top-1 error, top-5 error

Classification 논문에서 자주 사용하는 지표 중 Top-1 error와 Top-5 error 가 있습니다.Image Classifier는 이미지가 주어지면 {고양이, 0.8}, {개, 0.7} 와 같이 class와 confidence score의 결과값을 반

2021년 8월 11일
·
0개의 댓글
post-thumbnail

Dropout & Bottleneck feature & Batch normalization

딥러닝 관련 논문 및 포스팅을 보다보면 Dropout, Bottleneck-feature, Batch-normalization라는 용어를 많이 볼 수 있습니다.이 글에서는 이 용어들에 대해 알아보려고 합니다.Dropout은 overfitting을 피하기 위한 방법 중

2021년 8월 10일
·
0개의 댓글
post-thumbnail

Fine-tuning vs Transfer-learning vs Backbone

딥러닝을 공부하면서 여러가지 코드나 라이브러리를 보면backbone, fine-tuning, transfer learning 등의 용어가 자주 등장합니다.이 용어들의 차이점을 알아봅시다.모델의 layer가 많아질수록 학습되는 parameter의 양이 많아지고 학습시간이

2021년 8월 6일
·
0개의 댓글