인공지능 1 - 4강

nahye·2021년 5월 13일
0

AI School

목록 보기
5/8

인공지능

사고의 법칙에 대한 탐구

확률론에 기초한 학문 = 인공지능

컴퓨터가 '생각'이란 것을 하게 만들 수 있는가
인간이 일반적으로 수행하는 지적작업을 자동화 하려는 노력

인간의 모든 지식 기호화하고,
이 관계들을 모두 컴퓨터에 학습시키는 기호주의 인공지능은 1950년대부터 1980년대 후반까지 인공지능 분야의 지배적인 패러다임이었다.

하드웨어의 한계

2020년 구글에서 개발한 ML 전용 하드웨어 TPU(Tensor Processing Unit)은 ML에서 주로 사용되는 선형대수 연산을 가속화시켜 신경망 모델 학습 시간을 혁신적으로 단축시켰다.

인지 컴퓨팅 소셜 로봇

인간의 몸은 체화된 인지의 중심 원리

인지 컴퓨팅은 인간의 뇌를 모델로 하는 컴퓨터 시스템이다.
의학, 맞춤형 서비스, 인간과의 상호작용 등의 목적으로 제작된다.

뉴럴 네트워크

궁극적으로는 실존적 위협이 아니다.
결국 인류의 지속적 번영을 도와줄 것이다.

현재 인공지능 산업의 선두를 달리고 있는 나라는?

중국

중국은 인간의 뇌를 모방해 방대한 정보를 기억하고 처리하는 이른바 뉴로모픽 컴퓨팅이 중국 브레인 프로젝트의 한 축을 이루고 있다.

베이징에서는 2030년까지 전세계에서 지배적 위치를 구축한다는 목표아래 수십억 달러 규모의 새로운 인공지능 연구 계획이 시작되고 있다.

방대한 개인적보를 사유권으로 인정하는 국가들보다 중국은 훨씬 유리한 상황이기에 빠르게 진행된다.

지금의 인공지능은 기업 그리고 단기적인 상품과 서비스에 집중 되어 있다.
미래를 위해 조금 더 깊이 있는 기초에 집중하는 것을 권장한다.

'자동화 하려는 노력'

머신러닝과 인공지능

플루트 연주 인형을 비롯한 오토마타는 산업 혁명기에 등장한 인공지능 분야의 선구자 격 작품으로 남게 되었다.

인공지능의 선구자 중 한 명인 엘런 튜링은
논문 『Computing machinery and intelligence』에서 에이다 러브레이스의 발언을 인용하여 "범용 계산기는 학습과 독창성을 발휘할 수 있다"라고 결론 내렸다.

머신러닝

사람이 데이터 뿐 아니라 데이터에서 예상되는 해답까지 입력 한 후 규칙을 뽑아내는 구조로 설계되며, 이러한 구조로 뽑아낸 규칙을 신규 데이터에 적용
인간이 아닌 컴퓨터가 정의한 규칙을 통해 해답이 산출 된다.

명시적인 프로그래밍이 아닌 훈련의 과정을 진행하게 되며, 주어진 임무와 관련된 다수의 데이터를 접한 후, 이 데이터 속에서 통계적 구조를 찾아내어 임무 완료 과정을 자동화하는데 필요한 규칙을 제시

대규모 데이터셋과 고속처리 하드웨어로 인해 인공지능 하위 분야중 가장 인기를 끌게 됨

통계학 뿐만이 아닌 데이터 마이닝 또한 데이터 셋을 정제하고, 그 속에 숨겨진 패턴을 찾는 것이다.

머신러닝과 통계학 다른 점

  1. 머신러닝은 통계학과 달리 베이즈 분석과 같은 고전적인 통계 분석에 비교적 효율적이지 못 하다.

  2. 머신러닝은 통계학에서 사용되는 데이터보다 더욱 복잡 및 대규모 데이터셋 처리해야함

  3. ML, DL 상대적으로 적은 수학 이론 표출하며 공학적인 측면을 더 지향한다.

  4. 머신러닝 분야에서는 하나의 아이디어에 대해 '이론'보다는 '경험'을 통해 아이디어를 입증하는 경우가 많다.

실제로 신경망의 정확도 및 과적합을 방지하는데 효과적인 드롭아웃 기법이 탄생한 배경은 제프리 힌튼의 번뜩이는 아이디어에서 시작해 다수의 실험에 거쳐 탄생함.

인공지능

머신러닝

인공지능이 풀 수 있는 문제와 풀 수 없는 문제를 정확하게 구분하고 누군가에게 설명 가능해야 함

딥러닝

머신러닝 알고리즘이 '하는 일'

머신러닝을 위한 3가지

  1. 입력데이터
    예) 음성인식 - 사람 목소리, 이미지 태그 작업 - 사진

  2. 예상 출력값

    음성인식 작업인 경우 사운드 파일을 듣고, 원고 형태로 옮긴 것일 수도 있고,
    이미지작업의 경우라면 '강아지'나 '고양이' 등과 같은 태그일 수 있습니다.

  3. 알고리즘 정확도 측정법

    알고리즘의 현재 출력과 예상출력 사이의 거리를 결정하는데 필요하다.
    이 측정치는 알고리즘 작동 방식을 조정하는 피드백 신호로 사용되며 일반적으로 이러한 조정 단계를 '학습' 이라 한다.

"데이터를 의미있는 것으로 변환하는 것"

표현 : 데이터를 대표하게 하거나 데이터를 부호화 하기 위해 데이터를 색다르게 살펴보는 방법

색을 부호화 하는 것
표현방식을 바꾸는 것만으로도 수행방식이 쉬워질 수 있다.

흰색점과 검은색 점을 깔끔하게 구분하는 데이터의 새로운 표현 필요

데이터 변형
흑백 분류문제를 간단한 규칙 문제로 사용 가능

머신러닝에서의 학습:
더 나은 표현을 자동으로 찾아내는 과정

뇌를 형성하는 뉴런의 집합체를 수학 모델로 나타낸 것이 신경망의 출발점이며 신경망의 계층을 다양한 방식으로 연속되게 구조화 한 방식이 딥러닝이다.

=> 데이터 표현들을 여러 단계를 거쳐 배우는 방식이라고 생각하기

딥러닝 학습 방법

입력 데이터는 다음 해당 계층에 의해 데이터가 특정화 된 다음 이 계층의 가중치라는 형태로 저장됨
가중치는 본질적으론 여러 숫자로 된 덩어리

그리고 이후 다양한 계층을 반복적으로 통과하며 학습을 진행함

이 모든 과정을
가중치를 조절하는 반복작업이라 생각할 수 있음

의구심

심층 신경망에서는 수천만개의 가중치가 존재하며, 모든가중치들을 대상으로 올바른 값을 찾는 일은 쉽지 않을 것
특히 가중치는 하나의 값을 수정하면 다른 모든 가중치에 영향을 주기에 더욱 더 그럼

신경망의 출력을 제어하려면 이 출력이 예상한 것과
얼마나 차이가 나는지를 측정할 수 있어야 한다.

목적함수인 신경망의 손실함수 (loss function)
손실함수는 실제 결과값과 신경망이 예측한 결과값을 가지고 거리점수를 계산하여 신경망이 얼마나 잘 수행되었는지 계산해 낸다.

딥러닝의 기본 기법은 이 점수를 피드백 신호로 사용해
현재 사례의 손실 점수를 낮추는 방향으로 무작위 가중치값들을 조금씩 조절해나간다.

이러한 조절방식은 주로 역전파 알고리즘을 통해 구현하는데 우선은 가볍게 신경망의 손실 점수를 낮춰주는 하나의 방식이라 생각하기

최종적으로 손실이 최소화된 신경망은 우리가 원하는 값에 가장 근접한 출력을 낼 수 있으며 이는 곧 가장 잘 훈련된 신경망이라 할 수 있다.

profile
Slow and steady wins the race

0개의 댓글