[CS50] Chapter 1: 컴퓨터와 컴퓨팅 - Topic 7~9

Ha Young Do·2021년 8월 6일
0

Topic 7. 컴퓨터는 어떻게 이미지 파일을 구별할 수 있을까요?

  • 이미지를 무한히 확대하려고 할 때, 이미지가 가지고 있는 비트의 수가 유한하기 때문에 선명도에도 한계가 있다.
  • 미디어 파일은 흔히 JPEG, GIF, PNG 등등의 확장자를 가지고 있는데, 각각 특정한 비트 패턴으로 식별할 수 있다. 주로 파일 도입부에 확장자 정보가 저장되어 있어서 컴퓨터가 읽고 적절한 형식으로 렌더할 수 있다.

이미지 파일의 종류

  • bmp: 가장 단순하게 저장, 압축하지 않아 파일 크기가 크다.
  • jpeg: 압축률이 좋고 고해상도를 나타나기에 적합하다.
  • gif: 압축저장 방식을 사용해 이미지 전송을 빠르게 할 수 있고, jpeg보다 압축률이 낮지만 압축 시 원본 손상이 적다.
  • png: gif보다 압축률이 좋고 jpeg보다 원본 손상이 적다.

생각해보기

  1. 왜 이미지 파일 유형들은 헤더를 가지고 있을까요?
  • 저장 형식에 따라 저장된 정보를 구성하는 구조가 다르기 때문에, 컴퓨터가 파일의 종류를 식별해 올바르게 해석할 수 있게 하기 위해서

Topic 8. 현실 보다 더 생생한 세상

VR vs. AR

  • VR (virtual reality)
    인간이 디바이스를 통해 가상의 공간을 체험하고 상호작용할 수 있도록 만들어 주는 기술
    양안 시차를 사용하여 양쪽 눈에 서로 다른 각도로 촬영된 영상을 재생시켜 입체감을 줄 수 있다.
    모션 트래킹 센서를 통해 사람의 움직임을 측정하여 시선에 맞는 영상을 재생한다.
  • AR (augmented reality)
    현재 환경 위에 가상의 효과를 입히는 기술 (예: 포켓몬GO)

가상현실, 증강현실 활용 예시

  • 시간, 장소, 위험부담을 줄인 사실적 체험이 가능
  • 제조: 자동차 생산 과정에서 사용하여 작업자 부상률 감소
  • 의료: 수술과정 교육, 공포 불안장애 및 ptsd 치료에 효과적
  • 게임: 몰입감 있는 게임플레이 가능
    이외 쇼핑 시 상품정보, 길찾기 등의 분야에서 사용될 수 있다.

생각해보기

  1. 논의된 것 외에 어떤 분야에서 VR과 AR을 적용할 수 있을까요?
  • 관광, 여행: 직접 가보지 않고 가상으로 방문해 체험이 가능
    리테일: 직접 물건을 보러 매장에 방문하지 않아도 구경할 수 있음 (판매자는 실제 물건을 비치해 놓을 필요가 없음)
  1. VR과 AR을 사용하다 보면 어떤 윤리적 문제가 생길 수 있을까요?
  • 최근 세상을 떠난 퍼포머들을 가상현실 기술을 통해 재구현하여 퍼포먼스를 감상할 수 있게 하는 콘서트, 이벤트 등이 있었으나, 고인에게 그들의 image와 identity를 재구성하여 사용하는데에 대한 승인을 받지 못했으므로 프라이버시, '잊혀질 권리' 등에 대한 윤리적 문제가 발생할 수 있다.

Topic 9. 정해진 답만 할 수 있는 컴퓨터는 옛날 이야기

NLP란?

  • natural language processing, 자연어 처리
    인간이 일상적으로 사용하는 언어 (자연어) 를 처리하여 기계가 알아들을 수 있는 기계어로 변환시켜 주는 시스템
  • ELIZA (1966, Joseph Weizenbaum 개발)
    정신과 의사와의 상호작용을 모방하기 위해 처음 개발되었다.
    실제로 기계가 자연어를 이해하기보다는, 인풋에서부터 특정 패턴을 뽑아내어 일부분을 변형시켜 아웃풋으로 내보내는 형식

음성 인식 기술

  1. phonetic model
    인풋으로 들어온 데이터를 분석하여 이 음성이 어떤 단어와 일치할 확률이 가장 큰지 알아내는 기술
  2. pronunciation model
    동일 단어라도 사람, 억양, 쓰임새에 따라 발음이 달라질 수 있기에 이에 따른 발음의 변화를 감지하는 기술
  3. language model
    특정 단어들은 서로 조합되어 등장할 확률이 크다, 일기예보라는 단어는 보통 오늘, 내일 등의 단어와 함께 등장하지, 엉뚱하게 아티초크 등의 단어와 함께 조합되지는 않는다. 는 점에 착안하여 문장을 파악하는 기술

질문에 대답하기

  • 음성을 인식한 이후에 컴퓨터가 그 음성에 대한 의미를 이해해야 적절한 처리를 해 줄 수 있다.
    내일 뉴 헤이븐 일기예보 같은 음성은 의미를 파악하고 처리할 수 있지만 일기예보 하마 아티초크 뉴 헤이븐 같은 단어의 나열은 컴퓨터가 그 의미를 이해할 수 없기 때문에 처리가 불가
  1. syntactic processing
    문법 규칙에 따라 특정 단어들은 특정 역할을 수행하고 (동사, 명사 등), 단어들을 조합하는 방법 중 맞는 방법이 있고 틀린 방법이 있다는 것을 파악하는 기술
  2. semantic processing
    각각의 단어의 의미를 파악하는 기술
    존은 메리를 사랑한다 라는 문장이 주어졌을 때 존과 메리가 고유명사이며, 특정 인물을 가리킨다는 것을 파악
    사랑한다라는 단어는 동사이며 두 고유명사 간의 특정한 관계를 나타낸다는 것을 파악.
  3. pragmatic processing
    받은 문자열의 단어들을 가지고 그에 상응하는 실제로 존재하는 정보, 물건, 사건, 사람 등이 있는지 파악하고 찾아올 수 있는 기술
    squad helps dog bite victim이라는 문장이 주어졌을 때,
    개가 피해자를 깨무는 것을 도와주다 인지 개에게 물린 피해자를 도와주다 인지 파악해야 하는데, syntactic/semantic processing만으로는 역부족이다.

비언어적 소통

  • siri와 같은 AI에게 같은 내용을 화난 목소리, 기쁜 목소리 등으로 질문해도 항상 같은 답이 나온다.
  • 다른 인터페이스의 경우 비언어적 소통 수단 (감정, 표정) 등을 인식하고 처리할 수도 있음.

머신 러닝

  • 인공지능을 구현하기 위한 기술
  • 컴퓨터가 데이터를 가지고 스스로 학습하여 패턴을 파악하도록 함
  • 데이터의 연관성과 구조를 파악하려면 다량의 데이터로 트레이닝이 필요함

생각해보기

  1. 보드게임을 할 때 왜 사람은 AI가 하는 것만큼 많은 가능성을 고려하지 않아도 되는 것인가요? 어떤 가능성을 고려할지 어떤 방식으로 제한하는 것일까요?
  • 인간은 AI가 가지고 있지 않은 context에 대한 정보나 intuition, 특정 상황에 대해 누적되어 있는 노하우 등이 있으므로 자연스럽게 모든 가능성을 동일하게 바라보지 않아도 된다. 이에 비해 AI는 가능성에 대한 주관적인 데이터가 없기 때문에 모든 가능성을 평등하게 바라보고 그 중 최적화된 쪽으로 움직인다.
profile
Codestates Software Engineering Full IM 28th

0개의 댓글