1) 학습
2) 피어세션
AI, ML, DL의 차이?
딥러닝에서 중요 포인트
Data
- 데이터는 풀어야할 문제의 유형에 의존한다.
Model
- 같은 데이터가 주어져도 모델에 따라 결과가 다르다.
Loss
- 모델을 어떻게 학습할지? parameter를 어떻게 업데이트 할지?
- Reression:
- Classification:
- Probabilistic: = (MSE)
Optimization
2012 - AlexNet
- 딥러닝이 실제로 성능을 발휘
2013 - DQN
- 강화학습
2014 - Endocer / Decoder
- 기계어 번역의 트렌드 변화
2014 - Adam Optimizer
2015 - GAN(Generative Adversarial Network)
2015 - Residual Networks
- 네트워크를 어느정도 깊게 쌓을 수 있음을 증명
2017 - Transformer
2018 - BERT
- 위키피디아 같은 다수의 데이터로 Pre-training 후 소수의 데이터로 Fine-Tuning
2019 - BIG Language Models
2020 - Self Supervised Learning
데이터 시각화란 데이터를 그래픽 요소로 매핑하여 시각적으로 표현하는 것
데이터셋의 종류 1
- 정형 데이터
- 테이블 형태로 제공되는 데이터, 일반적으로 csv, tsv 파일로 제공
- row가 데이터 1개 item
- column은 attribute(feature)
- 가장 쉽게 시각화할 수 있는 데이터셋
- 시계열 데이터
- 시간 흐름에 따른 데이터
- 기온, 주가 등 정형데이터와 음성, 비디오와 같은 비정형 데이터 존재
- 시간 흐름에 따른 추세(Trend), 계절성(Seasonality), 주기성(Cycle) 등을 살핌
- 지리 데이터
- 지도 정보와 보고자 하는 정보 간의 조화가 중요
- 관계형(네트워크) 데이터
- 객체와 객체 간의 관계를 시각화
- 계층적 데이터
- 관계 중에서도 포함관계가 분명한 데이터
- 다양한 비정형 데이터
데이터셋의 종류 2
- 수치형 (numerical)
- 연속형 (continuous): 길이, 무게, 온도 등
- 이산형 (discrete): 주사위 눈금, 사람 수 등
- 범주형 (categorical)
- 명목형 (norminal): 혈액형, 종교 등
- 순서형 (ordinal): 학년, 별점, 등급 등
- 마크: 이미지에서 기본적인 graphical 요소 (점, 선, 면)
- 채널: 각 마크를 변경할 수 있는 요소들
import numpy as np
import matplotlib as mpl
import matplotlib.pyplot as plt
# 기본 틀
fig = plt.figure()
plt.show()
# 서브 플롯 추가
flg = plt.figure()
ax = fig.add_subplot()
plt.show()
# figure사이즈 조절
flg = plt.figure(figsize=(12, 7))
ax = fig.add_subplot()
plt.show()
# 여러개 그리기
fig = plt.figure()
ax = fig.add_subplot(121)
ax = fig.add_subplot(122)
plt.show()
fig = plt.figure()
ax = fig.add_subplot()
x = [1, 2, 3]
plt.plot(x)
plt.show()
# 서브플롯 객체에 그리기
fig = plt.figure()
x1 = [1, 2, 3]
x2 = [3, 2, 1]
ax1 = fig.add_subplot(211)
ax2 = fig.add_subplot(212)
ax1.plot(x1)
ax2.plot(x2)
plt.show()
# 한 서브플롯에 여러 개 그리기
fig = plt.figure()
ax = fig.add_subplot(111)
# 3개의 그래프 동시에 그리기
ax.plot([1, 1, 1]) # 파랑
ax.plot([1, 2, 3]) # 주황
ax.plot([3, 3, 3]) # 초록
plt.show()
# 다른 종류 그래프 그리기
fig = plt.figure()
ax = fig.add_subplot(111)
# 선그래프와 막대그래프 동시에 그리기 (색 명시해주어야 한다.)
ax.plot([1, 2, 3], [1, 2, 3])
ax.bar([1, 2, 3], [1, 2, 3])
plt.show()
fig = plt.figure()
ax = fig.add_subplot(111)
# 3개의 그래프 동시에 그리기
ax.plot([1, 1, 1], color='r') # 한 글자로 정하는 색상
ax.plot([2, 2, 2], color='forestgreen') # color name
ax.plot([3, 3, 3], color='#000000') # hex code (BLACK)
plt.show()
fig = plt.figure()
ax = fig.add_subplot(111)
ax.plot([1, 1, 1], label='1')
ax.plot([2, 2, 2], label='2')
ax.plot([3, 3, 3], label='3')
ax.set_title('Basic Plot')
ax.legend()
plt.show()
fig = plt.figure()
ax1 = fig.add_subplot(1, 2, 1)
ax2 = fig.add_subplot(1, 2, 2)
ax1.set_title('ax1')
ax2.set_title('ax2')
fig.suptitle('fig') # super
plt.show()
fig = plt.figure()
ax = fig.add_subplot(111)
ax.plot([1, 1, 1], label='1')
ax.plot([2, 2, 2], label='2')
ax.plot([3, 3, 3], label='3')
ax.set_title('Basic Plot')
ax.set_xticks([0, 1, 2])
ax.legend()
plt.show()
ax.text(x=1, y=2, s='This is Text')
ax.annotate(text='This is Annotate', xy=(1, 2),
xytext=(1.2, 2.2),
arrowprops=dict(facecolor='black'),
)