BIG_PY LEVEL 2 스터디 1주차

Jiwon Lee·2022년 7월 20일

AI BIG_PY KUS 머신러닝 빅데이터 인공지능 한권으로다지는머신러닝&딥러닝

BIG_PY

목록 보기

3/4

Chapter 1. 인공지능 소개

💡 수학… 안 보니까 기분 좋다 … ㅋ ㅠㅠ 미안해요ㅕ

😅 AI란 무엇인가

AI = 일반적으로 자가 지각이 필요한 작업을 기계가 수행하는 방법을 연구하는 컴퓨터 과학 분야

→ 기계가 사람의 지능을 거의 유사하게 모방하는 방법을 연구하는 컴퓨터 과학 분야 ( 제한적 정의 )

AI를 왜 공부해야 하는가

우리 삶의 모든 측면에 영향을 미칠 수 있음 → 많은 부분의 자동화

개체의 패턴과 행동을 이해
AI를 통해 스마트 시스템을 구축하고 지능이라는 개념을 이해
→ 인간의 뇌와 같은 지능 시스템이 어떻게 다른 지능 시스템을 구축하는지 이해

뇌 기능을 모방해 뇌와 비슷하거나 더 나은 지능 시스템으로 만드는 일이 바로 AI 연구

AI의 능력

우리는 뇌를 통해 사물을 인식하고, 언어를 이해하고,
새로운 것을 배우는 등 정교한 작업 수행

→ 이런 작업을 기계로 모방해보면 작업 능률이 훨씬 떨어짐

AI의 이상적인 모델 = 인간의 뇌

→ 인간의 부족한 부분을 AI를 이용한 지능형 기계를 설계하고 개발하여 유용하게 수행할 수 있도록 하는 것이 중요함 !

우리가 사는 세상

뇌가 처리하지 못할 정도로 많은 데이터
데이터는 여러 소스에서 동시 생성되며 체계화 되지 않은 제멋대로인 형태
데이터는 계속 변하고 파생된 지식은 지속적으로 갱신됨
감지와 작동은 높은 정밀도를 기반으로 실시간으로 이루어짐

우리에게 필요한 AI 시스템

많은 데이터 효율적으로 처리
지연 없이 여러 소스에서 동시 데이터 수집
새로운 데이터 학습 → 올바른 학습 알고리즘 사용하여 지속적으로 갱신 및 상황 대응
휴식 없이 작업 가능

😆 인공지능의 종류

AI의 다양한 분류 방법

지도 학습 / 비지도 학습 / 강화 학습 → 데이터 제공 방식
인공 일반 지능(AGI) / 좁은 인공지능(ANI)
인간의 기능에 따른 분류
- 머신 비전
- 머신러닝
- 자연어 처리
- 자연어 생성

공통적인 분류 ; 머신러닝과 패턴 인식

머신러닝 = 가장 인기 있는 AI 분야 중 한 가지… 새로운 데이터 시스템 입력 시, 훈련 데이터의 패턴을 통해 새로운 데이터 추론

ex ) 얼굴 인식 소프트웨어는 기존 데이터 베이스에서 눈, 코, 입, 눈썹 등의 패턴을 찾아 일치시킴

프로그래밍 방법

논리 기반 AI	수학적 논리를 사용	패턴 일치, 언어 구문 분석, 의미 분석
검색	많은 가능성 검토 후 최적의 경로 선택	전략게임( 체스 등 ), 네트워킹, 리소스 할당, 스케줄링
지식 표현	효율적으로 지식을 표현 → 시스템을 이해할 수 있도록 함

수학적 논리의 언어가 자주 사용됨 | |
| 온톨로지 | 지식 표현과 밀접한 분야,
도메인 내의 개체의 속성 및 관계 표현

서로 연결, 관계 있어야 가치 있는 지식 ! | |
| 계획 | 최소 비용 / 최대 수익인 최적의 계획 찾기

사실과 목표에 대한 진술로 시작하며 여러 사실에 관한 정보를 인지 후, 규칙 확인 | |
| 휴리스틱 | 단기간 문제 해결에 유용한 기술, 경험을 통해 추측 및 결정함

머신러닝의 다섯 가지 그룹

아이디어가 생겨난 과학 분야에 따라 머신러닝 분류 ( 페드로 도밍고스 제시 )

그룹	근본 분야	주요 알고리즘
기호주의자	논리 및 철학	역추론	일련의 전제와 결론으로 시작해 누락된 부분을 채워나가는 backward
연결주의자	신경과학	역전파	뇌를 느슨하게 모델링한 알고리즘, 패턴 인식
→ 숫자 패턴을 인식하므로 모두 숫자 벡터로 변환
진화주의자	생물학	유전 프로그래밍	진화, 자연선택, 게놈, DNA 돌연변이 개념 사용
→ 지속적인 변화와 진화, 적응
베이즈주의자	통계학	확률적 추론	확렬적 추론을 통해 불확실성 처리에 중점
→ 선험적 추론 유형 적용 후 가설 갱신
유사주의자	심리학	커널 머신	예제 간의 유사성을 찾는 기술에 중점을 두는 K-최근접 이웃( KNN ) 등의 모델

😗 AI의 정의에 관해

튜링 테스트를 사용한 지능 정의

Turing Test : 기계가 인간의 행동을 모방하는 방법을 학습할 수 있는지 확인하는 방법

텍스트 인터페이스로 질문자가 심문, 응답자는 사람인지 기계인지 모름 → 맞출 수 있는가 ??

이를 위해 기계가 능숙해야 하는 것 = 자연어 처리, 지식표현, 추론, 머신러닝

→ Total Turing Test는 시각과 움직임을 다룸 … 기계가 물체를 보고 로봇을 사용해 이동해야 함

기계가 인간처럼 생각하도록 만들기

뇌가 사물의 우선순위를 지정하는 방법

인지 모델링

인간이 어떻게 문제를 해결하는가 !

문제 해결 과정에 들어가는 정신 과정을 소프트웨어로 바꿈

→ 인간의 사고 과정을 시뮬레이션

🤑 합리적 에이전트 구축

AI 연구는 합리적 에이전트 구축에 초점을 둠

여기서 말하는 합리성 = 바람직한 결과를 얻기 위해 일련의 규칙을 관찰하고 논리적 의미를 따름

→ 성능 = 성공의 정도

입력을 행동으로 전환, 요점을 명확히 하기 위해 시나리오 설정

ex) 자율 주행 자동차가 시속 100km로 달릴 때 누군가가 갑자기 길을 건넌다면 ?

탑승자가 죽을 것을 알면서 가드레일 충돌
그대로 달려 길을 건너는 보행자와 충돌

이 중 옳은 결정을 하는 것이 중요

일반 문제 해결사 ( GPS ; General Problem Solver )

AI 세계에 등장한 최초의 유용한 컴퓨터 프로그램 ( 허벌트 사이먼, 제이씨 쇼, 앨런 뉴웰 제안 )

목표 → 프로그램이 궁극적인 문제 해결 기계로 동작 ( 특정 작업에만 한해서가 아님 ! )

GPS를 사용한 문제 해결

목표를 정의

ex) 식료품점에서 우유 구매
전제 조건을 정의, 목표와 관련이 있어야 함

ex) 식료품점에서 우유를 구입하려면 운송 수단이 있어야 하며 식료품점은 우유를 판매해야 함
오퍼레이터를 정의

ex) 교통수단이 자동차라면 자동차에 연료가 부족할 때 비용을 지불하고 주유할 수 있어야 함.
또한 식료품점에서 우유를 구입할 비용이 있어야 한다.

→ 조건과 이에 영향을 미치는 모든 것을 관리
→ 여러 행동, 전제 조건, 행동으로 인한 변경으로 구성됨

⇒ 문제를 하나의 프레임으로 만들 수 있다면 GPS 동작! 그러나 복잡하고 시간이 오래 걸리는 검색 프로세스를 사용해야 한다는 제약 존재 …

😵 지능형 에이전트 구축

에이전트에 지능을 전달하는 방법에는 여러가지 존재 ( 머신러닝, 저장된 지식, 규칙 )

학습 모델을 기반으로 추론 엔진 실행
어떤 행동을 할지 결정 후 액추에이터로 전송
센서는 입력을 감지해 특성 추출 블록으로 전송
훈련된 추론 엔진이 학습 모델을 기반으로 예측

→ 머신러닝을 통해 구축 가능 !

😮 모델 유형

분석 모델
- 최종 방정식에 도달하기 위해 따르는 일련의 단계
- 문제점: 인간의 판단에 근거
학습된 모델
- 데이터 분석에 능숙함
- 예측 사용 가능한 데이터를 관리하는 매우 복잡한 방정식 생성

Chapter 2. 인공지능 사용 사례

💡 쉬워 보여도 내용이 많긴 하네요 … 쿡쿡. … 3-4장도 겁나 많겠지?? 나 왜 2번째 순서지 …

🤩 대표적인 AI 사용 사례

인공지능은 금융, 의학 및 일상생활 등 다양한 산업에 영향 …

→ 일상 생활에서 많이 사용하는 AI 응용 사례에 초점을 맞춤.

디지털 개인 비서와 챗봇

챗봇( Chat Bot ) = 메신저로 유저와 소통하는 봇 ( 사람이 아닌 AI )

구글 어시스턴트 → 전화기, 헤드폰, 스피커, 세탁기, TV, 냉장고 등 다양한 기기에서 사용
아마존 알렉사 → 아마존에서 개발한 가상 비서로, 명령을 통해 사용자와 상호작용 → 음성 및 음악 재생, 할 일 목록 생성, 알람 생성, 오디오북 재생, 질문 답변 기능
애플 시리 → 사용자의 음성 멸령을 받고 자연어 처리 사용자 인터페이스를 제공.
마이크로소프트 코타나 → 가상 비서로서 자연어 음성 명령 인식 및 정보 사용.

자율 주행 자동차

사람의 도움 없이 미리 설정된 경로를 따라 이동하는 차량을 의미함

Level 0	자동화 없음	운전자가 모든 책임을 짐 …
Level 1	운전자 지원	특정 조건 하에서 자동차의 속도나 방향 제어 자동화 ( ACC 등 )
Level 2	부분 자동화	특정 상황에서 조향, 가속, 제동 자동화 ( 테슬라 오토 파일럿 등 )
Level 3	조건부 자동화	적절한 조건하에 시스템은 주변 환경을 모니터링하고 자동차를 제어 → 모니터링하는 책임이 운전자에서 시스템으로 넘어감, 시스템이 처리할 수 없을 때는 운전자가 처리 !
Level 4	높은 자동화	지역이 제한된 공유 자동차 모델에서 사람이 운전에 전혀 관여하지 않을 수 있음 → 개인 소유 자동차는 도면 도로에서 운전자가 모든 운전 업무를 관리 할 수 있고, 고속도로에서는 시스템이 이를 대신함
Level 5	완전 자동화	무인 시스템이 모든 도로와 조건에서 차량을 제어하고 운영

자율 주행 기술 선도 기업 → 구글 웨이모, 우버 ATG 등…

배송과 창고 관리

고객으로부터 주문을 받아 상품을 배송할 위치를 결정하고, 로봇은 창고에서 주변 팔레트와 재고를 운반하는 노새 역할 → 컴퓨터, 로봇, 인간이 잘 조율하면서 실수 없이 빠른 배송

인간의 건강

| 신약 개발 | 제약 충족 프로그래밍을 이용해 신약 후보들을 생성한 뒤 일부 후보를 빠르게 제거
→ 신약 발견 속도를 높임

컴퓨터 시뮬레이션 실험을 통해 비용 절감, 머신러닝을 이용하여 임상 시험 기간을 예측
HTS & VHTS처럼 실제 실험을 수행하되, 로봇을 사용하기도 함

자연어 처리를 통해 게놈 데이터를 일련의 문자로 사용해 표현 및 처리
보험 결정	머신러닝 알고리즘을 이용한 피보험자 예측을 통해 적절한 보험료 측정 가능
환자 진단	정교한 규칙 엔진과 머신러닝을 사용해 더 나은 진단을 내리고 진료 효율을 높임
의료 영상 해석	머신러닝 모델을 이용하여 CT, MRI, X-ray로 얻은 정보를 해석 가능
정신 분석	AI 챗봇으로 환지의 행동을 시뮬레이션 → 정신과 의사의 후속 치료를 제공
스마트 건강 기록	데이터 과학을 이용하여 환자 데이터 캡처를 간소화, 환자의 활력 징후에 대한 실시간 읽기와 분석이 포함
→ 미래 인공지능 엔진이 정보를 실시간으로 분석하여 체내 포도당 수치 조정, 약을 투여, 응급 시 의료 지원 요청을 가능하게 할 수 있음
질병 감지와 예측	인간 게놈을 머신러닝 모델에 입력하고, 방대한 데이터 세트를 통해 다양한 질병과 상태 감지하고 예측

지식 검색

구글 검색 - 구글 제안 기술

2015년 초 랭크브레인 이라는 딥러닝 시스템을 사용하여 검색 쿼리 응답 생성을 지원함

→ 컴퓨터가 이해할 수 있는 벡터라는 수학적 개체에 인간 언어를 삽입, 랭크브레인이 익숙하지 않은 단어나 구를 발견하면 어떤 단어나 구가 비슷한 의미를 가지는지 추측

→ 결과를 필터링하여 이전에 보지 못한 검색을 보다 효과적으로 처리 가능

스마트 홈

자동화 기기를 사용하여 집안일 수행 ( 옷 세탁 및 건조, 옷 개기, 저녁 요리, 이불 정리, 바닥에서 물건 줍기, 걸레질, 먼지 털기, 진공 청소, 설거지, 집안 모니터링 등 … )

→ 비용 문제로 인하여 완전한 자동화는 오래 걸릴 것 !

현재 발전된 사례 | 홈 모니터링 | 사용자가 집에서의 활동을 스마트폰으로 확인 가능
비디오 초인종과 온도 조절기 등 … → 비용 절감 효과도 존재 |
| --- | --- |
| 진공 청소와 걸레질 | 작은 로봇으로 집 청소 가능 … 로봇 청소기 귀여워 ~ |
| 요리 | 패스트푸드점 처럼 주방 일이 반복적인 곳에서는 자동화가 적합
고급 레스토랑에서도 부분 자동화 적용 사례 존재 |

게임

AI가 어려운 게임의 GOSU를 지속적으로 이기게 된 것은 불과 몇년 전 !

컴퓨터 프로그래밍을 통하여 세계 최고 선수들을 이김

스타크래프트2 AI를 사용해 지도 학습과 강화 학습을 사용해 원래의 게임 데이터로 학습한 심층 신경망 사용
제오파디 자연어로 제기된 질문에 답할 수 있는 질의 응답 시스템인 왓슨
체스 → 딥블루
바둑 → 알파고 → 후속작은 트리 검색 알고리즘을 사용해 이전에 학습된 지식을 기반으로 동작을 찾음

영화 제작

딥페이크 ( Deep Fake ) 비디오 이미지를 병합하는 AI 기술 ( 가상의 비디오 생성 … ) → 가짜 뉴스, 리벤지 포르노 등으로 악용될 수 있으므로 유의해야 함
영화 스크립트 생성 딥러닝 기술을 사용하여 영화 대본을 제작 ( 장단기 메모리; LSTM 모델 사용 )

인수 및 거래 분석

인수( 언더라이팅 ) → 기관이 보험료를 받는 대가로 재정적 위험을 감수할 것인지 결정하는 과정

보험 증권 발행	건강, 생활, 가정, 운전 등 분야
대출	할부 대출, 신용카드, 부동산 담보 대출, 상업 신용 한도
증권 인수 및 기업공개 (IPO)

보험 정책이나 대출 발행 여부, 잘못된 결정을 내릴 경우, 비용 발생 경우 등을 결정 !

ex) 순자산이 높은 개인이 최근 세계 여행을 마치고 돌아온 후, 3개월 전에 유명한 의료기관에 취직, 신용 점수 800점 이상 …

→ 주어진 상황은 신용 위험도 측면에서 좋아 보이지만, 일반적인 인수 규칙에서는 2년간 근로 활동을 하지 않았기 때문에 자격 상실도 가능

→ 머신러닝 모델은 이를 가치 있다 판단하여 대출 승인 가능, 실례를 통해 학습

예를 들어 제스트 파이낸스는 데이터 모델링 결과를 완전히 설명하고, 비즈니스 영향을 측정, 규제 요구 사항을 준수함 → AI의 블랙 박스 방지

또한 이곳의 숨은 무기는 아래와 같은 비전통적인 데이터를 포함한다는 점임

고객 지원 데이터, 지불 내역, 구매 내역
고객이 양식을 작성하는 방법
고객이 사이트에 도착하는 데 사용하는 방법 혹은 사이트를 탐색하는 방법
신청서를 작성하는데 걸린 시간

🥺 데이터 정리와 변환

기름-자동차 처럼 데이터는 AI의 생명선 !

→ 일관되고, 재현 가능하고, 정확한 AI 모델을 생성하려면 깨끗하고 정확한 데이터를 확보해야 함

데이터 과학자들은 입력 데이터를 준비하는 데에만 총 시간의 80%를 사용할 정도 …

ex) Amazon Lake Formation

데이터 수집, 정리, 중복 제거, 카탈로그 작성 및 게시를 비롯해 데이터 레이크 생성에 일반적으로 포함되는 몇몇 단계들을 자동화 → 데이터를 분석하고 머신러닝 구축.

→ 데이터가 거치는 자동화 준비, 정리, 분류 작업 일부는 머신러닝을 사용해 자동으로 수행.

관련 도구들

데이터브릭스, 태블로, 아마존 레드시프트, 아마존 아테나, AWS 글루, 아마존 EMR, 아마존 퀵사이트, 아마존 세이지메이커

→ 각자 선호하는 분석 및 머신러닝 서비스를 사용해 좀 더 쉽게 데이터 분석 가능

Jiwon Lee

노는 게 제일 좋은데 공부는 하고 싶어요 😗

이전 포스트

BIG_PY 22-1학기 세션 정리

다음 포스트