BIG_PY LEVEL 2 스터디 1주차

Jiwon Lee·2022년 7월 20일
1

BIG_PY

목록 보기
3/4

Chapter 1. 인공지능 소개

💡 수학… 안 보니까 기분 좋다 … ㅋ ㅠㅠ 미안해요ㅕ

😅 AI란 무엇인가

AI = 일반적으로 자가 지각이 필요한 작업을 기계가 수행하는 방법을 연구하는 컴퓨터 과학 분야

→ 기계가 사람의 지능을 거의 유사하게 모방하는 방법을 연구하는 컴퓨터 과학 분야 ( 제한적 정의 )

AI를 왜 공부해야 하는가

우리 삶의 모든 측면에 영향을 미칠 수 있음 → 많은 부분의 자동화

  1. 개체의 패턴과 행동을 이해
  2. AI를 통해 스마트 시스템을 구축하고 지능이라는 개념을 이해
    → 인간의 뇌와 같은 지능 시스템이 어떻게 다른 지능 시스템을 구축하는지 이해

뇌 기능을 모방해 뇌와 비슷하거나 더 나은 지능 시스템으로 만드는 일이 바로 AI 연구

AI의 능력

우리는 뇌를 통해 사물을 인식하고, 언어를 이해하고,
새로운 것을 배우는 등 정교한 작업 수행

→ 이런 작업을 기계로 모방해보면 작업 능률이 훨씬 떨어짐

AI의 이상적인 모델 = 인간의 뇌

→ 인간의 부족한 부분을 AI를 이용한 지능형 기계를 설계하고 개발하여 유용하게 수행할 수 있도록 하는 것이 중요함 !

우리가 사는 세상

  • 뇌가 처리하지 못할 정도로 많은 데이터
  • 데이터는 여러 소스에서 동시 생성되며 체계화 되지 않은 제멋대로인 형태
  • 데이터는 계속 변하고 파생된 지식은 지속적으로 갱신됨
  • 감지와 작동은 높은 정밀도를 기반으로 실시간으로 이루어짐

우리에게 필요한 AI 시스템

  • 많은 데이터 효율적으로 처리
  • 지연 없이 여러 소스에서 동시 데이터 수집
  • 새로운 데이터 학습 → 올바른 학습 알고리즘 사용하여 지속적으로 갱신 및 상황 대응
  • 휴식 없이 작업 가능

😆 인공지능의 종류

AI의 다양한 분류 방법

  • 지도 학습 / 비지도 학습 / 강화 학습 → 데이터 제공 방식
  • 인공 일반 지능(AGI) / 좁은 인공지능(ANI)
  • 인간의 기능에 따른 분류
    • 머신 비전
    • 머신러닝
    • 자연어 처리
    • 자연어 생성

공통적인 분류 ; 머신러닝과 패턴 인식

머신러닝 = 가장 인기 있는 AI 분야 중 한 가지… 새로운 데이터 시스템 입력 시, 훈련 데이터의 패턴을 통해 새로운 데이터 추론

ex ) 얼굴 인식 소프트웨어는 기존 데이터 베이스에서 눈, 코, 입, 눈썹 등의 패턴을 찾아 일치시킴

프로그래밍 방법

논리 기반 AI수학적 논리를 사용패턴 일치, 언어 구문 분석, 의미 분석
검색많은 가능성 검토 후 최적의 경로 선택전략게임( 체스 등 ), 네트워킹, 리소스 할당, 스케줄링
지식 표현효율적으로 지식을 표현 → 시스템을 이해할 수 있도록 함

수학적 논리의 언어가 자주 사용됨 | |
| 온톨로지 | 지식 표현과 밀접한 분야,
도메인 내의 개체의 속성 및 관계 표현

서로 연결, 관계 있어야 가치 있는 지식 ! | |
| 계획 | 최소 비용 / 최대 수익인 최적의 계획 찾기

사실과 목표에 대한 진술로 시작하며 여러 사실에 관한 정보를 인지 후, 규칙 확인 | |
| 휴리스틱 | 단기간 문제 해결에 유용한 기술, 경험을 통해 추측 및 결정함

최선을 위해 모든 가능성을 확인할 수 없는 상황이 빈번하므로 사용됨 | 로봇공학, 검색 엔진 |
| 유전 프로그래밍 | 프로그램 매칭과 최적값 선택을 통해 문제 해결
주어진 작업을 잘 수행하는 프로그램 얻기 위해 사용되며, 유전자 세트로 인코딩 됨 | |

머신러닝의 다섯 가지 그룹

아이디어가 생겨난 과학 분야에 따라 머신러닝 분류 ( 페드로 도밍고스 제시 )

그룹근본 분야주요 알고리즘
기호주의자논리 및 철학역추론일련의 전제와 결론으로 시작해 누락된 부분을 채워나가는 backward
연결주의자신경과학역전파뇌를 느슨하게 모델링한 알고리즘, 패턴 인식
→ 숫자 패턴을 인식하므로 모두 숫자 벡터로 변환
진화주의자생물학유전 프로그래밍진화, 자연선택, 게놈, DNA 돌연변이 개념 사용
→ 지속적인 변화와 진화, 적응
베이즈주의자통계학확률적 추론확렬적 추론을 통해 불확실성 처리에 중점
→ 선험적 추론 유형 적용 후 가설 갱신
유사주의자심리학커널 머신예제 간의 유사성을 찾는 기술에 중점을 두는 K-최근접 이웃( KNN ) 등의 모델

😗 AI의 정의에 관해

튜링 테스트를 사용한 지능 정의

Turing Test : 기계가 인간의 행동을 모방하는 방법을 학습할 수 있는지 확인하는 방법

텍스트 인터페이스로 질문자가 심문, 응답자는 사람인지 기계인지 모름 → 맞출 수 있는가 ??

이를 위해 기계가 능숙해야 하는 것 = 자연어 처리, 지식표현, 추론, 머신러닝

Total Turing Test는 시각과 움직임을 다룸 … 기계가 물체를 보고 로봇을 사용해 이동해야 함

기계가 인간처럼 생각하도록 만들기

뇌가 사물의 우선순위를 지정하는 방법

인지 모델링

인간이 어떻게 문제를 해결하는가 !

문제 해결 과정에 들어가는 정신 과정을 소프트웨어로 바꿈

→ 인간의 사고 과정을 시뮬레이션


🤑 합리적 에이전트 구축

AI 연구는 합리적 에이전트 구축에 초점을 둠

여기서 말하는 합리성 = 바람직한 결과를 얻기 위해 일련의 규칙을 관찰하고 논리적 의미를 따름

→ 성능 = 성공의 정도

입력을 행동으로 전환, 요점을 명확히 하기 위해 시나리오 설정

ex) 자율 주행 자동차가 시속 100km로 달릴 때 누군가가 갑자기 길을 건넌다면 ?

  1. 탑승자가 죽을 것을 알면서 가드레일 충돌
  2. 그대로 달려 길을 건너는 보행자와 충돌

이 중 옳은 결정을 하는 것이 중요

일반 문제 해결사 ( GPS ; General Problem Solver )

AI 세계에 등장한 최초의 유용한 컴퓨터 프로그램 ( 허벌트 사이먼, 제이씨 쇼, 앨런 뉴웰 제안 )

목표 → 프로그램이 궁극적인 문제 해결 기계로 동작 ( 특정 작업에만 한해서가 아님 ! )

GPS를 사용한 문제 해결

  1. 목표를 정의

    ex) 식료품점에서 우유 구매

  2. 전제 조건을 정의, 목표와 관련이 있어야 함

    ex) 식료품점에서 우유를 구입하려면 운송 수단이 있어야 하며 식료품점은 우유를 판매해야 함

  3. 오퍼레이터를 정의

    ex) 교통수단이 자동차라면 자동차에 연료가 부족할 때 비용을 지불하고 주유할 수 있어야 함.
    또한 식료품점에서 우유를 구입할 비용이 있어야 한다.

    → 조건과 이에 영향을 미치는 모든 것을 관리
    → 여러 행동, 전제 조건, 행동으로 인한 변경으로 구성됨

⇒ 문제를 하나의 프레임으로 만들 수 있다면 GPS 동작! 그러나 복잡하고 시간이 오래 걸리는 검색 프로세스를 사용해야 한다는 제약 존재 …


😵 지능형 에이전트 구축

에이전트에 지능을 전달하는 방법에는 여러가지 존재 ( 머신러닝, 저장된 지식, 규칙 )

  1. 학습 모델을 기반으로 추론 엔진 실행
  2. 어떤 행동을 할지 결정 후 액추에이터로 전송
  3. 센서는 입력을 감지해 특성 추출 블록으로 전송
  4. 훈련된 추론 엔진이 학습 모델을 기반으로 예측

→ 머신러닝을 통해 구축 가능 !


😮 모델 유형

  1. 분석 모델
    • 최종 방정식에 도달하기 위해 따르는 일련의 단계
    • 문제점: 인간의 판단에 근거
  2. 학습된 모델
    • 데이터 분석에 능숙함
    • 예측 사용 가능한 데이터를 관리하는 매우 복잡한 방정식 생성

Chapter 2. 인공지능 사용 사례

💡 쉬워 보여도 내용이 많긴 하네요 … 쿡쿡. … 3-4장도 겁나 많겠지?? 나 왜 2번째 순서지 …

🤩 대표적인 AI 사용 사례

인공지능은 금융, 의학 및 일상생활 등 다양한 산업에 영향 …

일상 생활에서 많이 사용하는 AI 응용 사례에 초점을 맞춤.

디지털 개인 비서와 챗봇

챗봇( Chat Bot ) = 메신저로 유저와 소통하는 봇 ( 사람이 아닌 AI )

  • 구글 어시스턴트 → 전화기, 헤드폰, 스피커, 세탁기, TV, 냉장고 등 다양한 기기에서 사용
  • 아마존 알렉사 → 아마존에서 개발한 가상 비서로, 명령을 통해 사용자와 상호작용 → 음성 및 음악 재생, 할 일 목록 생성, 알람 생성, 오디오북 재생, 질문 답변 기능
  • 애플 시리 → 사용자의 음성 멸령을 받고 자연어 처리 사용자 인터페이스를 제공.
  • 마이크로소프트 코타나 → 가상 비서로서 자연어 음성 명령 인식 및 정보 사용.

자율 주행 자동차

사람의 도움 없이 미리 설정된 경로를 따라 이동하는 차량을 의미함

Level 0자동화 없음운전자가 모든 책임을 짐 …
Level 1운전자 지원특정 조건 하에서 자동차의 속도나 방향 제어 자동화 ( ACC 등 )
Level 2부분 자동화특정 상황에서 조향, 가속, 제동 자동화 ( 테슬라 오토 파일럿 등 )
Level 3조건부 자동화적절한 조건하에 시스템은 주변 환경을 모니터링하고 자동차를 제어 → 모니터링하는 책임이 운전자에서 시스템으로 넘어감, 시스템이 처리할 수 없을 때는 운전자가 처리 !
Level 4높은 자동화지역이 제한된 공유 자동차 모델에서 사람이 운전에 전혀 관여하지 않을 수 있음 → 개인 소유 자동차는 도면 도로에서 운전자가 모든 운전 업무를 관리 할 수 있고, 고속도로에서는 시스템이 이를 대신함
Level 5완전 자동화무인 시스템이 모든 도로와 조건에서 차량을 제어하고 운영

자율 주행 기술 선도 기업 → 구글 웨이모, 우버 ATG 등…

배송과 창고 관리

고객으로부터 주문을 받아 상품을 배송할 위치를 결정하고, 로봇은 창고에서 주변 팔레트와 재고를 운반하는 노새 역할 → 컴퓨터, 로봇, 인간이 잘 조율하면서 실수 없이 빠른 배송

인간의 건강

| 신약 개발 | 제약 충족 프로그래밍을 이용해 신약 후보들을 생성한 뒤 일부 후보를 빠르게 제거
→ 신약 발견 속도를 높임

  • 컴퓨터 시뮬레이션 실험을 통해 비용 절감, 머신러닝을 이용하여 임상 시험 기간을 예측
  • HTS & VHTS처럼 실제 실험을 수행하되, 로봇을 사용하기도 함
  • 자연어 처리를 통해 게놈 데이터를 일련의 문자로 사용해 표현 및 처리
    보험 결정머신러닝 알고리즘을 이용한 피보험자 예측을 통해 적절한 보험료 측정 가능
    환자 진단정교한 규칙 엔진과 머신러닝을 사용해 더 나은 진단을 내리고 진료 효율을 높임
    의료 영상 해석머신러닝 모델을 이용하여 CT, MRI, X-ray로 얻은 정보를 해석 가능
    정신 분석AI 챗봇으로 환지의 행동을 시뮬레이션 → 정신과 의사의 후속 치료를 제공
    스마트 건강 기록데이터 과학을 이용하여 환자 데이터 캡처를 간소화, 환자의 활력 징후에 대한 실시간 읽기와 분석이 포함
    → 미래 인공지능 엔진이 정보를 실시간으로 분석하여 체내 포도당 수치 조정, 약을 투여, 응급 시 의료 지원 요청을 가능하게 할 수 있음
    질병 감지와 예측인간 게놈을 머신러닝 모델에 입력하고, 방대한 데이터 세트를 통해 다양한 질병과 상태 감지하고 예측

지식 검색

구글 검색 - 구글 제안 기술

2015년 초 랭크브레인 이라는 딥러닝 시스템을 사용하여 검색 쿼리 응답 생성을 지원함

→ 컴퓨터가 이해할 수 있는 벡터라는 수학적 개체에 인간 언어를 삽입, 랭크브레인이 익숙하지 않은 단어나 구를 발견하면 어떤 단어나 구가 비슷한 의미를 가지는지 추측

→ 결과를 필터링하여 이전에 보지 못한 검색을 보다 효과적으로 처리 가능

추천 시스템

데이터에 크게 의존하며 처리하는 데이터가 많을 수록 강력해짐

→ 고객 데이터에 숨겨진 힘을 활용할 수 있음

음식점, 영화, 음악, 검색 결과, 금융 서비스 등에서 사용 가능

  • 😘 추천 시스템 개선 / 구성 요소

    • 사용자가 이전에 선택한 항목을 사용하는 것 → 영화를 추천하였을 때 보면 계속 그에 관련된 장르 추천, 보지 않은 영화는 추천하지 않음
    • 초기 사용자의 선택과 관련이 없을 수 있는 무작위 요인
  • 넷플릭스 상

  • 판도라

  • 베터먼트 → 로보어드바이저

스마트 홈

자동화 기기를 사용하여 집안일 수행 ( 옷 세탁 및 건조, 옷 개기, 저녁 요리, 이불 정리, 바닥에서 물건 줍기, 걸레질, 먼지 털기, 진공 청소, 설거지, 집안 모니터링 등 … )

→ 비용 문제로 인하여 완전한 자동화는 오래 걸릴 것 !

  • 현재 발전된 사례 | 홈 모니터링 | 사용자가 집에서의 활동을 스마트폰으로 확인 가능
    비디오 초인종과 온도 조절기 등 … → 비용 절감 효과도 존재 |
    | --- | --- |
    | 진공 청소와 걸레질 | 작은 로봇으로 집 청소 가능 … 로봇 청소기 귀여워 ~ |
    | 요리 | 패스트푸드점 처럼 주방 일이 반복적인 곳에서는 자동화가 적합
    고급 레스토랑에서도 부분 자동화 적용 사례 존재 |

게임

AI가 어려운 게임의 GOSU를 지속적으로 이기게 된 것은 불과 몇년 전 !

컴퓨터 프로그래밍을 통하여 세계 최고 선수들을 이김

  • 스타크래프트2 AI를 사용해 지도 학습과 강화 학습을 사용해 원래의 게임 데이터로 학습한 심층 신경망 사용
  • 제오파디 자연어로 제기된 질문에 답할 수 있는 질의 응답 시스템인 왓슨
  • 체스 → 딥블루
  • 바둑 → 알파고 → 후속작은 트리 검색 알고리즘을 사용해 이전에 학습된 지식을 기반으로 동작을 찾음

영화 제작

  • 딥페이크 ( Deep Fake ) 비디오 이미지를 병합하는 AI 기술 ( 가상의 비디오 생성 … ) → 가짜 뉴스, 리벤지 포르노 등으로 악용될 수 있으므로 유의해야 함
  • 영화 스크립트 생성 딥러닝 기술을 사용하여 영화 대본을 제작 ( 장단기 메모리; LSTM 모델 사용 )

인수 및 거래 분석

인수( 언더라이팅 ) → 기관이 보험료를 받는 대가로 재정적 위험을 감수할 것인지 결정하는 과정

보험 증권 발행건강, 생활, 가정, 운전 등 분야
대출할부 대출, 신용카드, 부동산 담보 대출, 상업 신용 한도
증권 인수 및 기업공개 (IPO)

보험 정책이나 대출 발행 여부, 잘못된 결정을 내릴 경우, 비용 발생 경우 등을 결정 !

ex) 순자산이 높은 개인이 최근 세계 여행을 마치고 돌아온 후, 3개월 전에 유명한 의료기관에 취직, 신용 점수 800점 이상 …

→ 주어진 상황은 신용 위험도 측면에서 좋아 보이지만, 일반적인 인수 규칙에서는 2년간 근로 활동을 하지 않았기 때문에 자격 상실도 가능

→ 머신러닝 모델은 이를 가치 있다 판단하여 대출 승인 가능, 실례를 통해 학습

예를 들어 제스트 파이낸스는 데이터 모델링 결과를 완전히 설명하고, 비즈니스 영향을 측정, 규제 요구 사항을 준수함 → AI의 블랙 박스 방지

또한 이곳의 숨은 무기는 아래와 같은 비전통적인 데이터를 포함한다는 점임

  • 고객 지원 데이터, 지불 내역, 구매 내역
  • 고객이 양식을 작성하는 방법
  • 고객이 사이트에 도착하는 데 사용하는 방법 혹은 사이트를 탐색하는 방법
  • 신청서를 작성하는데 걸린 시간

🥺 데이터 정리와 변환

기름-자동차 처럼 데이터는 AI의 생명선 !

→ 일관되고, 재현 가능하고, 정확한 AI 모델을 생성하려면 깨끗하고 정확한 데이터를 확보해야 함

데이터 과학자들은 입력 데이터를 준비하는 데에만 총 시간의 80%를 사용할 정도 …

ex) Amazon Lake Formation

데이터 수집, 정리, 중복 제거, 카탈로그 작성 및 게시를 비롯해 데이터 레이크 생성에 일반적으로 포함되는 몇몇 단계들을 자동화 → 데이터를 분석하고 머신러닝 구축.

→ 데이터가 거치는 자동화 준비, 정리, 분류 작업 일부는 머신러닝을 사용해 자동으로 수행.

관련 도구들

데이터브릭스, 태블로, 아마존 레드시프트, 아마존 아테나, AWS 글루, 아마존 EMR, 아마존 퀵사이트, 아마존 세이지메이커

→ 각자 선호하는 분석 및 머신러닝 서비스를 사용해 좀 더 쉽게 데이터 분석 가능


profile
노는 게 제일 좋은데 공부는 하고 싶어요 😗

0개의 댓글