강의1주차 강의는 Python과 AI&Math에 관련된 기초적인 강의들로 구성되어 있었다.python 부분은 그나마 기존에 알고 있던 내용이 더 많았기 때문에 수월하게 학습했다. AI&Math 파트는 확률, 통계적 부분이 어렵게 느껴졌다. 가장 어려웠던 부분은 MLE에
❓ Why Pytorch? 보편적으로 사용하는 딥러닝 프레임 워크에는 tensorflow, pytorch, keras가 있다. keras는 초급자도 사용하기 쉬운 직관적인 문법을 갖고 있다는 장점이 있다. 하지만 그만큼 세세한 부분을 사용자 마음대로 바꿀 수 없기
🐥 Autograd & Optimizer pytorch를 활용한 딥러닝 연산의 핵심은 autograd이다. 자동 미분이 되도록 설정해두면 알아서 편미분을 해서 각 변수별로 업데이트까지 수행한다. ❓어떻게 하면 자동 미분을 설정할 수 있을까 torch.nn.p
최근 딥러닝 모델을 산업에서 적용할 때 나타나는 양상은 다음과 같다.학습 대상 데이터의 타입이 유사하면서 대용량 데이터에 대해 학습한 모델을 가져온다.그 모델을 갖고 있는 데이터로 further learning 시킨다.대표적으로는 이미지 분야에서는 imageNet, 자
🌈 모델을 한 번 다 만들었다고 끝이 아니고 목표한 성능에 도달하기 위해 계속해서 수정이 이루어진다. 모델 학습을 한 번 하는 데에만 해도 많은 시간이 걸리고 일일이 그 앞에 앉아서 컴퓨터만 바라보고 있을 수 없기 때문에 학습이 이루어지고 난 후에 그 과정을 볼 수
Pytorch를 사용할 때 다양한 에러와 문제들을 접하게 된다. 자주 나올 수 있는 trouble을 어떻게 해결할 지에 대해 다뤄보고자 한다. 정의메모리 부족으로 모델 작동이 되지 않아 생기는 오류문제점왜, 어디서 문제가 발생했는지 알기 어려움메모리의 이전 상황을 파악
인공지능(Artificial Intelligence): 동적 컴퓨팅 환경 내에 내장된 알고리즘을 생성하고 적용하여 인간의 지능을 모방하는 기초적인 지능손실함수(loss function): 모델의 예측값과 실제값 사이 차이를 수식화한 함수최적화(optimization):
CNN이란 Convolution Neural Network의 약자로, 합성곱 연산을 수행하는 모델을 의미한다. 이미지 데이터를 학습하는 데에 사용하는 것으로 익히 알려져 있다. MLP로 이미지 데이터를 학습할 수도 있을 것이다. 하지만 이미지는 픽셀 값 뿐만 아니라 공
Sequential data는 시계열적 특성을 가진 데이터로써 오디오, 영상, 텍스트 등 우리 일상에 가장 흔한 데이터라고 볼 수 있다. Sequential data의 경우 fully connected layer로 처리를 하기에는 정해진 input의 크기가 명확하지
Transformer는 Sequential Data에 대한 예측 및 분류를 하기 위한 모델이다. RNN도 Sequential Data를 예측하는 대표적 모델로 소개되고 있다. 하지만 순차적으로 입력 데이터를 처리하는 RNN의 특성 상 언어 데이터를 다룬다고 할 때 중간
넘쳐나는 컨텐츠와 상품들 사이에서 유저의 취향을 반영한 제품을 추천해주는 시스템도 발전하고 있다. 추천 시스템은 유저 개개인에게 적합한 상품을 추천해주기 위해서 유저 정보, 상품 정보, 유저와 상품의 상호작용 정보를 활용한다.개인의 취향을 반영해 좋아할만한 제품을 추천
git은 개발자들이 프로젝트를 할 때 사용하게 되는 유용한 툴이다. 왜 필요할까?버그를 찾아 수정하는 시간을 줄이고 협업 시 효율적인 병합을 위해 사용한다. 200만 줄이 넘어가는 코드를 작성하고 수정을 한다고 할 때 에러가 나면 어떤 부분이 문제인지 바로 알 수 있을
Definition user가 item에 대해 행동한(ex. 구매, 클릭, 평점 등) 데이터를 기반으로 여러 user의 관심사를 예측하는 기법 NBCF(Neighborhood-based CF)의 핵심 원리는 알고자 하는 예측 대상과 유사한 대상을 이용해 관
추천시스템에서 딥러닝을 활용하는 경우는 다른 AI 분야에 비해서는 많지 않은 편이다. 머신러닝 모델과 딥러닝 모델 간의 성능 차이가 그리 크지 않기도 하고 서빙 속도가 중요한 추천 특성 상 연산량이 많은 딥러닝 모델을 쓰기가 쉽지 않기 때문이다. 그럼에도 대용량의 유저
Graph는 객체 간 관계와 같은 추상적인 개념을 효율적으로 나타낼 수 있게 해준다. Graph 데이터에 적용 가능한 신경망을 GNN이라고 한다. NGCF는 추천시스템에 GNN을 적용하는 게 효과적이라는 사실을 증명한 초기 논문에서 제시한 모델의 이름이다. CF 모
여러 개발자들이 함께 프로젝트를 진행할 때 git을 이용하게 된다.한 파일 내에서 공동 작업을 하고 업데이트한 내용을 병합해야 할텐데, 이때 필요한 작업 순서에 대해 알아보고자 한다. repository name(project 명)과공개범위를 설정해줄 수 있다. 생성한
MF를 이용하는 CF 모델의 경우, 유저 - 아이템 상호작용 정보만을 사용하기 때문에 만약 상호작용이 적은 초기 상태의 경우는 추천이 잘 이루어지기 쉽지 않다. (cold start)context aware recommendation은 이를 완화하기 위해 최대한 활용할
window에서 외부 서버로 접속하기 위해서는openvpn 연결ssh로 서버 연결이렇게 2단계로 구성된다. openvpn 설치위 사이트에 들어가서 openvpn connect를 다운 받는다. 제공받은 .ovpn 파일을 더블클릭하면 자동으로 openvpn connect에