AIFFEL 에서는 교육생들의 편의를 위해 클라운드 컨테이너를 제공하고 있다. 즉, PC 에 GPU가 장착이 되어있지 않더라도 클라우드를 통해 GPU 등의 가상의 컴퓨터 자원을 사용할 수 있는 것이다.클라우드 컨테이너에 설치된 개발 환경은 다음과 같다.Ubuntu 18
🤝 협업 능력에 대해 개발자에게 꼭 필요한 능력 중 하나는 협업 능력 이다. 개발을 진행하며 다른 사람과 협업하며 코드가 점점 길어짐에 따라 이러한 버전 관리의 필요성이 커진다. 소스 코드의 버전 관리를 도와주는 시스템 중 하나가 Git 과 GitHub 이다.
Jupyter Notebook 이란?데이터 클리닝과 변형, 통계 모델링, 머신러닝 등 데이터 분석을 편리하게 할 수 있도록 최적화 되어있는 오픈소스 웹 어플리케이션 이다.주피터 노트북은 사용법이 간편하고 시각화에 강해 데이터 분석에 주로 사용된다.
핵심 요약 운영체제의 구성과 커널의 역할
사람이 컴퓨터에게 일을 시키려면 컴퓨터가 알아들을 수 있는 언어로 일을 시켜야한다. 바로 그 언어가 프로그래밍 언어이다. 수많은 프로그래밍 언어 중 하나인 파이썬은 본래 교육용으로 만들어진 언어로, 코드가 간결하고 알아보기 쉽다. 그러한 장점으로 인해, 파이썬은 현재
컴퓨터는 모든 종류의 데이터를 0과 1의 이진 데이터(binary data) 로 표현한다. 이러한 이진 데이터의 최소 단위가 비트(bit) 이고, 비트 8개가 모여 바이트(byte) 가 되어 메모리에는 바이트로
✅ 핵심 내용list 와 array에 대한 이해Numpy, PandasList 는 파이썬에서 별도의 import 없이 사용 가능한 임의의 데이터 타입을 담을 수 있는 가변적 시퀀스(sequence)형이다. 또한 리스트안의 요소 사이에 다른 타입의 자료형이 허용된다.반면
✅ 핵심 내용파이썬 라이브러리 Pandas, Matplotlib, Seaborn 등을 이용한 다양한 그래프데이터 시각화를 통한 탐색적 데이터 분석 (EDA)데이터 시각화는 데이터를 잘 분석하기 위한 필수이다. 각종 데이터를 그 데이터 특성과 용도에 맞는 다양한 그래프를
✅ 핵심 내용 전체 데이터 분석 순서 이해 결측치, 이상치 처리 데이터 정규화 원-핫 인코딩 (One-Hot Encoding) 구간화 " 데이터 분석의 80퍼센트는 데이터 전처리이다. " 라는 말이 있듯이 데이터 분석에 있어 데이터 전처리 과정은 아주 중요하다
✅ 핵심 내용 dataset feature 이해 및 분석 그래프 시각화, pivot table 등을 활용하여 다양한 방법으로 EDA 진행 전처리가 필요한 데이터 전처리 적절한 모델을 선택해 학습시키며 베이스라인과 비교 🔍 EDA (Exploratory Data A
✅ 핵심 내용 머신러닝의 다양한 알고리즘 이해 Scikit-learn 라이브러리 사용법 Scikit-learn 을 통한 train, test 데이터 나누기 🤖 머신러닝(Machine Learning) 머신 러닝이란 말 그대로 기계가 학습을 통해 스스로 발전하는
✅ 핵심내용컴퓨터에서 이미지가 표현되는 방식 이해Pillow와 OpenCV로 Python 에서 이미지 정보 추출히스토그램을 기반으로 유사한 이미지 골라내기디지털 화면은 수많은 점들로 이루어져 있으며, 색상을 가지는 점 하나를 화소(pixel, picture elemen
✅ 핵심내용파이썬 클래스에 대한 이해클래스를 활용한 객체 지향 프로그래밍Everything in Python is an object, and almost everything has attributes and methods.라는 말이 있듯이 파이썬에서는 모든 것이 객체(
✅ 핵심내용딥러닝과 머신러닝의 차이딥러닝의 '표현 학습' 이해함수 차원에서 신경망 모델 이해선형성에 대한 이해딥러닝과 머신러닝, 이 둘이 뭐가 다른가?관점에 따라 답이 다양하게 달라질수 있지만 일반적으로 인공지능이 가장 큰 범주이고, 그 안에는 머신러닝이, 또 그 안에
✅ 핵심내용비지도학습(Unsupervised Learning)클러스터링 - K-means, DBSCAN차원 축소 - PCA, T-SNE데이터셋은 라벨링이 되어 있지 않은 경우, 라벨링이 되어 있는 데이터셋을 마련하기 위해 많은 인적 자원이 필요하다. 이 문제를 해결하기
✅ 핵심내용Tensorflow V2의 개요와 특징Tensorflow V2의 3가지 주요 API 구성방식GradientTape를 활용해 보고 low 레벨의 딥러닝 구현방식 이해Tensorflow V1Tensorflow 를 유향 비순환 그래프(Directed Acyclic
✅ 핵심내용 딥러닝 네트워크들을 동물원 구경하듯 관찰 (Model Zoo) 딥러닝의 시작 ResNet, VGG ImageNet Challenge 이미지넷(ImageNet) 은 2010년 ILSVRC2010를 시작으로 1만 개가 넘는 카테고리에 대해 100만 장 규
✅ 핵심내용 레이어 개념 이해 딥러닝 모델 속 각 레이어(Linear, Convolution)의 동작 방식 이해 데이터의 특성을 고려한 레이어 설계 및 Tensorflow 로 정의 데이터의 형태 딥러닝을 이해하는 방법 중 가장 쉬운 방법은 데이터의 형태 변화를 관찰하
✅ 핵심내용희소표현, 분포가설, 분산표현레이어 개념 이해딥러닝 모델 속 각 레이어(Embedding, RNN, LSTM)의 동작 방식 이해데이터의 특성을 고려한 레이어 설계 및 Tensorflow 로 정의희소표현(Sparse Representation) : 벡터의 특정
✅ 핵심내용정칙화(Regularization),정규화(Normalization) 개념 이해L1 regularization과 L2 regularization의 차이Lp norm, Dropout, Batch Normalization 구현Regularization과 Norm
✅ 핵심내용 신경세포, 퍼셉트론의 구조 선형과 비선형 활성화 함수의 종류 (이진 계단 함수, 선형 활성화 함수, 비선형 활성화 함수) 퍼셉트론 딥러닝 모델은 보통 여러 개의 층으로 이루어져 있다. 그중에 하나의 층을 가져와 다시 쪼갠다면 보통 '노드'라고 불리는 것
✅ 핵심내용확률 변수로서의 모델 파라미터posterior, prior, likelihood 의 관계MLE, MAP 비교아래와 같이 일차함수 모델이 존재할때, $$y=f(x)=a x+b \\quad a, b \\in \\mathbb{R}$$실수 $a, b$ 는 $f$ 라
✅ 핵심내용 멀티태스킹 멀티프로세스 멀티스레드 멀티태스킹 빅데이터를 다루기 위해서는 컴퓨팅 자원을 최적화 하는 방법, 즉 병렬 컴퓨팅, 분산 컴퓨팅 등의 개념을 알아야한다. 동시성(Concurrency) : 하나의 processor가 여러 가지 task를 동시
✅ 핵심내용 데이터를 연산하는 방법 Pandas, Class 를 이용한 데이터 연산법 Database Pandas DataFrame 활용하여 데이터 다루기 SQL 은 데이터 연산 작업이 가능한 쿼리(query) 를 위한 언어이다. 파이썬 기반의 프레임워크인 Pand
✅ 핵심내용 Information Content Entropy Kullback Leibler Divergence Cross Entropy Loss Decision Tree와 Entropy Information Content 정보 이론(information theor