시작하기

더 깊은 이해를 위해 시리즈를 시작합니다

  • 저는 데이터 엔지니어, 데이터 분석가로 실무를 해왔고, 부동산과 기술이 결합된 프롭테크(Prop-Tech) 분야에서 데이터와 기술을 적용하여 기존 방식으로 해결하기 어렵거나 시간과 노력이 많이 필요했던 결과물을 손쉽게 제공하는 서비스(랜드북)를 운영해왔습니다.
  • 2017년 3월부터 2022년 7월까지의 근무를 정리하고 데이터 사이언티스트가 되고자 책과 영상 기반으로 학습을 시작했습니다. 첫 학습으로 데이터 사이언스팀의 리더셨던 대원님이 추천해주신 박해선님의 『혼자 공부하는 머신러닝+딥러닝』(한빛미디어, 2020)을 읽고 학습 예제를 따라 머신러닝을 처음 접하였습니다.
  • 2회독을 시작하며 학습 예제가 아닌 새로운 대상으로 학습한 내용을 적용해보면 더 깊은 이해가 될 것이라 생각하여 본 시리즈를 작성하게 되었습니다.
    ※ 1회독 때 작성한 노트파일은 github에 올려져 있습니다(github).

책 소개

박해선, 『혼자 공부하는 머신러닝+딥러닝』, 한빛미디어, 2020

  • 리디(RIDI)를 통해 e-book으로 구매하여 읽었습니다.

Chapter 01. 나의 첫 머신러닝

01-1. 인공지능과 머신러닝, 딥러닝

“이번 절에서는 인공지능, 머신러닝, 딥러닝이 무엇인지 알아보고 그 차이를 살펴보겠습니다.” - 박해선(2020)

인공지능(artificial intelligence)

  • 사람처럼 학습하고 추론할 수 있는 지능을 가진 컴퓨터 시스템을 만드는 기술

인공지능의 역사

  • 인공지능 태동기(1943~1956)
    • 1943, 워런 매컬러(Warren McCulloch)와 월터 피츠(Walter Pitts)가 최초로 뇌의 뉴런 개념을 발표(MCP 뉴런)
    • 1950, 앨런 튜링(Alan Turing)이 튜링 테스트(Turing Test) 발표
    • 1956, 다트머스 AI 컨퍼런스(Dartmouth AI Conference)
  • 인공지능 황금기(1956~1974)
    • 1957, 프랑크 로젠블라트(Frank Rosenblatt)가 로지스틱 회귀의 초기 버전으로 볼 수 있는 퍼셉트론(Perceptron) 발표
    • 1959, 데이비드 허블(David Hubel)과 토르스텐 비셀(Torsten Wiesel)이 고양이를 통해 시각 피질에 있는 뉴런 기능 연구(노벨상)
  • 1차 AI 겨울(1974~1980)
    • 컴퓨터 성능의 한계로 해결할 수 있는 문제가 한정되어 연구와 투자가 크게 감소
  • AI 붐(1980~1987)
    • 전문가 시스템(expert system) 등장
  • 2차 AI 겨울(1987~1993)
    • 또 다시 컴퓨터 성능의 한계로 시장 축소
  • 이후의 큰 사건
    • 1998, LeNet-5
    • 2012, AlexNet
    • 2015, TensorFlow
    • 2016, AlphaGo

인공지능의 현재

  • 영화와 소설에 등장하는 사람과 같은 또는 그 이상의 지능을 가진 인공지능을 인공일반지능(artificial general intelligence) 또는 강인공지능(Strong AI)라 부름
  • 우리가 현실에서 마주하고 있는 인공지능은 약인공지능(Week AI)으로, 아직까지는 특정 분야에서 사람의 일을 도와주는 보조 역할만 가능함

머신러닝(machine learning)

  • 규칙을 일일이 프로그래밍하지 않아도 자동으로 데이터에서 규칙을 학습하는 알고리즘을 연구하는 분야
  • 인공지능의 하위 분야 중에서 지능을 구현하기 위한 소프트웨어를 담당하는 핵심 분야
  • 통계학과 수학을 기반으로 하며 최근에는 컴퓨터 과학 분야가 발전을 주도하고 있음
  • 머신러닝 라이브러리인 사이킷런(scikit-learn)의 등장으로 누구나 파이썬으로 머신러닝 프로그램을 만들 수 있음

딥러닝(deep learning)

  • 많은 머신러닝 알고리즘 중에 인공 신경망(artificial neural network)을 기반으로 한 방법들의 통칭
  • 주요 사건
    • 1998, 얀 르쿤(Yann Lecun)이 최초의 합성곱 신경망인 LeNet-5을 만들어 손글씨 숫자를 인식하는데 성공
    • 2012, 제프리 힌턴(Geoffrey Hinton)의 팀이 합성곱 신경망을 사용한 AlexNet으로 이미지 분류 대회인 ImageNet에서 기존의 머신러닝 방법을 누르고 압도적인 성능으로 우승
    • 2016, 딥마인드의 알파고가 이세돌과의 대국에서 승리
  • 오픈소스 딥러닝 라이브러리
    • 2015, 구글의 텐서플로(TensorFlow)
    • 2018, 페이스북(현 메타)의 파이토치(PyTorch)

01-2. 코랩과 주피터 노트북

“이 책의 모든 코드는 웹 브라우저에서 파이썬 코드를 실행할 수 있는 코랩을 사용하여 작성했습니다. 본격적으로 머신러닝을 배우기 전에 구글 코랩에 대해 소개하고 간단한 사용법을 익히려 합니다.” - 박해선(2020)

구글 코랩(Colab)

  • 웹 브라우저에서 무료로 파이썬 프로그램을 테스트하고 저장할 수 있는 서비스
  • 클라우드 기반의 주피터 노트북 개발 환경

*참고자료 : 박해선, 『혼자 공부하는 머신러닝+딥러닝』, 한빛미디어, 2020

profile
가치를 만드는 데이터 분석가

0개의 댓글