profile
a personal blog
post-thumbnail

케라스 창시자에게 배우는 딥러닝 CH1

딥러닝이란 무엇인가? > 인공지능에 대한 기대 지난 몇 년간 인공지능은 미디어에서 경쟁적으로 보도하는 주제였으며, AI가 수행할 미래는 이따금 어둡게 그려질 때도, 유토피아처럼 그려지기도 했다. 우리는 이 책을 통해 AI 에이전트를 개발할 수 있는 사람들 중 하나가 될 것이고 첫번째 장에서 인공지능과 머신 러닝, 딥러닝에 대한 필수적인 개념을 소개한다. 인공 지능과 머신러닝, 딥러닝 초기 인공지능 분야에 대한 간결한 정의는 보통의 사람이 수행하는 지능적인 작업을 자동화하기 위한 연구 활동이었다. 오랜 기간 동안 많은 전문가는 프로그래머들이 명시적인 규칙을 충분히 많이 만들어 데이터를 다루면 인간 수준의 인공지능을 만들 수 있다고 믿었으나 이미지 분류, 음성 인식, 언어 번역과 같은 불분명한 문제를 해결하기 위한 명확한 규칙체계를 찾는 것은 사실상 불가능하였으며 이를 대체하기 위한 새로운 방법으로 머신러닝이 등장하였다. 머신러닝 컴퓨터가 유

2023년 2월 25일
·
0개의 댓글
·
post-thumbnail

케라스 창시자에게 배우는 딥러닝 CH12

머신 러닝 모델은 이미지, 음악, 글의 통계적 잠재 공간을 학습할 수 있다. 그 다음 이 공간에서 샘플을 뽑아 새로운 예술 작품을 만들 수 있다. 예를 들어 독주에서 오케스트라의 모든 악기 조합을 테스트할 수 있다. AI를 활용하는 작곡가는 일종의 파일럿이며, 출발 버튼을. 누르고 좌표를 설정하면 소리의 우주를 항해하는 우주선을 조정한다. 텍스트 생성 순환 신경망으로 시퀀스 데이터를 생성하는 방법을 살펴보도록 한다. 책이 서술될 때를 기준으로 가장 잘 알려진 생성 트랜스포머의 예는 GPT-3이다. 현재 이 글을 서술할 때에는 CHAT-GPT가 새로운 혁신으로서 사람들에게 서비스되고 있다. >Chat-GPT 현재 무료로 서비스 되고 있는 구글의 chat-gpt를 활용하여 여러 질문을 던져보았다. 간단한 답변이 아닌 매우 구체적이고 확장적인 답변을 주고있다. 1592년에 어떤 전쟁이 발생하였는지, Tottenham의 다음 리그 경기에 대한 생각또한 물어보았다. 창

2023년 2월 23일
·
0개의 댓글
·
post-thumbnail

케라스 창시자에게 배우는 딥러닝 CH11

자연어와 기계어 컴퓨터 과학에서 한국어나 영어 같은 사람의 언어를 기계를 위해 고안된 언어와 구별하기 위해 자연어(natural language)라고 부른다. 모든 기계어는 규칙이 먼저이고 규칙이 완성된 이후에야 이 언어를 사용한다. 하지만 사람의 언어는 먼저 사용되고 나중에 규칙이 생긴 경우이다. 자연어에서 규칙은 나중에 체계화 되며 사용자들에 의해 규칙이 무시되거나 변화하기도 한다. 즉 자연어는 복잡하고, 모호하고, 혼란스럽고, 불규칙하며, 끊임없이 변화한다. 텍스트 데이터 준비 미분 가능한 함수인 딥러닝 모델은 수치 텐서만 처리가능하다. 즉 원시 텍스트를 입력으로 사용할 수 없다. 텍스트 벡터화는 텍스트를 수치 텐서로 바꾸는 과정이다. 다양한 방법이 있지만 모두 동일한 템플릿을 따른다. 우선 텍스트를 표준화한다.(소문자화, 구두점제거) 텍스트를 토큰(token)단위로 분할한다. 각 토큰을 수치 벡터로 변환한다. 텍스트 분할(토큰화)는 세

2023년 2월 22일
·
0개의 댓글
·
post-thumbnail

케라스 창시자에게 배우는 딥러닝 CH10

시계열(timeseries)데이터는 일정한 간격으로 측정하여 얻은 모든 데이터를 말하며, 지금까지 보았던 데이터와 달리 시스템의 역학을 이해해야한다. 분류 : 하나 이상의 범주형 레이블을 시계열에 부여한다 이벤트 감지 : 연속된 데이터 스트림에서 예상되는 특정 이벤트 발생을 식별한다. 이상치 탐지 : 연속된 데이터 스트림에서 발생하는 비정상적인 현상을 감지한다. 일반적으로 비지도 학습으로 수행된다. 온도 예측 문제 이번 장에서 모든 코드 예제는 건물 지붕 위의 센서에서 최근 기록된 기압, 습도와 같은 매 시간 측정값의 시계열이 주어졌을 때 24시간 뒤의 온도를 예측하는 것이다. 타겟 값인 기온을 그래프로 나타낸 것은 다음과 같다. > split 데이터는 총 42만

2023년 2월 15일
·
0개의 댓글
·
post-thumbnail

케라스 창시자에게 배우는 딥러닝 CH9

9장 컴퓨터 비전을 위한 고급 딥러닝 8장까지는 이미지 분류 모델을 주로 다루었다. 일반적으로 3개의 주요 컴퓨터 비전 작업을 알아 둘 필요가 있다. 이미지 분류(image classification): 이미지에 하나 이상의 레이블을 할당하는 것이 목표이며, 단일 레이블 분류이거나 다중 레이블 분류일 수 있다. 이미지 분할(image segmentation): 이미지를 다른 영역으로 나누거나 분할하는 것이 목표이며, 사진에 만약 자전거를 탄 사람이 있다면 이미지 분할로 하여금 자전거와 사람을 분리하여 인식할 수 있다. 객체 탐지(object detection): 이미지에 있는 관심 객체 주변에 바운딩 박스 사각형을 그리는 것이 목표이며, 각 사각형은 하나의

2023년 2월 3일
·
0개의 댓글
·
post-thumbnail

케라스 창시자에게 배우는 딥러닝 CH8

8장 컴퓨터 비전을 위한 딥러닝 이 장에서 소개할 합성곱 신경망은 컨브넷(convnet)이라고 불리운다. 이 딥러닝 모델은 이제 거의 대부분의 컴퓨터 비전 애플리케이션에 사용된다. 간단한 컨브넷 만들기 다른 것은 모두 이전장에서 보았던 코드들이지만, Conv2D레이어와MaxPooling레이어의 역할을 이 코드 뒤에서 설명한다. 합성곱 연산이란 완전 연결 층과 합성곱 층 사이의 근본적인 차이는 Dense 층은 입력 특성 공간에 있는 전역 패턴을 학습하지만, 합성곱 층은 지역 패턴을 학습한다. 이미지일 경우

2023년 2월 1일
·
0개의 댓글
·
post-thumbnail

케라스 창시자에게 배우는 딥러닝 CH7_작성중

![] (https://velog.velcdn.com/images/aal2525/post/818880ea-b223-41ff-a38e-4bcbf6901784/image.png) > Chaper7. 케라스 완전 정복하기 이어지는 장에서 비전, 시계열, 자연어, 생성딥러닝에 대해 자세히 알아보기위해 Sequential 모델과 기본 fit() 루프 이상을 알아야한다. 7장에서는 케라스API를 사용하는 주요 방법을 완전히 마스터하도록 한다. 다양한 워크플로 케라스 API 설계는 복잡성의 단계적 공개(progressive disclosure)원칙을 따른다. 단계적 공개란 단계마다 점진적으로 학습하는 것을 뜻한다. > * 케라스에서 모델을 만드는 세가지 방법 * Sequential 모델 : 가장 시작하기 쉬운 API이며 기본적으로 하나의 파이썬 리스트이다. 함수형 API : 그래프 같은 모델 구조를 주로 다룬다. 이 API는 사용성과 유연성

2023년 1월 18일
·
0개의 댓글
·
post-thumbnail

케라스 창시자에게 배우는 딥러닝 CH6

Chaper6. 일반적인 머신 러닝 워크플로 keras.datasets에서 원하는 데이터를 추출하여 딥러닝 모델을 훈련할 수 있다면 매우 편리하겠지만, 실전에서는 이러한 편리한 툴은 존재하지 않는다. 일반적인 머신러닝 워크플로는 크게 세 부분으로 구성된다. 작업정의 : 문제 영역과 고객의 요청 이면에 있는 비즈니스 로직을 이해한다. 이에 따라 데이터를 수집하고, 데이터가 드러내는 내용을 이해하고 작업의 성공을 측정하는 방법을 선택한다. 모델개발 : 머신러닝 모델로 처리 가능하게끔 데이터를 변환하고 모델 평가방법과 평가에 대한 기준점을 선택하고, 일반화 성능을 가지며 과대적합가능한 첫 모델을 훈련한다. 그 후 가능한 최대의 일반화 성능에 도달할 때 까지 모델을 튜닝한다. `

2023년 1월 17일
·
0개의 댓글
·
post-thumbnail

케라스 창시자에게 배우는 딥러닝 CH2

Chaper2. 신경망의 수학적 구성 요소 딥러닝을 이해하기 위해서는 텐서, 텐서 연산, 미분, 경사하강법등의 개념에 친숙해져야한다. 2장에서는 이러한 이해를 위해 MNIST 데이터를 활용한다. 텐서(Tensor) 모든 머신 러닝 시스템은 일반적으로 텐서를 기본 데이터 구조로 사용한다. 텐서는 데이터를 위한 컨테이너(container)이다. 일반적으로 수치형 데이터를 다루므로 숫자를 위한 컨테이너이다. > 스칼라(랭크 - 0 텐서) 하나의 숫자만을 담고 있는 텐서를 스칼라 또는 스칼라 텐서 , 0D텐서라고 부른다. 스칼라 텐서의 축의 개수는 0이다. 축의 개수를 랭크(rank)라고도 부른다. > 벡터(랭크 - 1 텐서) 숫자의 배열을 `벡터(vector

2023년 1월 13일
·
0개의 댓글
·
post-thumbnail

케라스 창시자에게 배우는 딥러닝 CH5

![] (https://velog.velcdn.com/images/aal2525/post/225a136e-e919-44b3-9dd1-d4622358be65/image.png) 데이터에 대한 접근방법 > 머신러닝의 근본적인 이슈 최적화(optimaization)와 일반화(generalization) 사이의 줄다리기 최적화 : 가능한 훈련 데이터에서 최고의 성능을 얻으려고 모델을 조정하는 과정 일반화 : 훈련된 모델이 이전에 본 적 없는 데이터에서 얼마나 잘 수행되는지 의미 > 데이터의 관점에서 불확실한 특성 : 덜 익은 바나나와 익은 바나나의 구분을 가능하게 하는 특성은 무엇인가? 드문 특성과 가짜 상관관계 : 드문 특성 값에 대해 무시하지 않고 그것을 반영하는 것은 옳은 일인가? 이렇게 반영했을 때 만들어지는 상관관계는 가짜 상관관계일 확률이 높다. 결론으로는 딥러닝 모델을 향상시키는 가장 좋은 방법은 더 좋고, 더 많은 데이터에서

2023년 1월 13일
·
0개의 댓글
·
post-thumbnail

케라스 창시자에게 배우는 딥러닝 CH4

![] (https://velog.velcdn.com/images/aal2525/post/4aa8f9f8-6c38-47b3-8b12-357f0b201e36/image.png) > #### Chaper4. 신경망 시작하기 : 분류와 회귀 4장에서는 keras.datasets에서 제공하는 데이터들을 통해 실제로 keras의 신경망을 활용하여 end-to-end 머신러닝 워크 플로우를 경험해본다. 총 3가지의 데이터가 주어지며 이진 분류 문제, 다중 분류 문제, 회귀 문제를 다루게 될 것이다. 이진 분류 문제 > IMDB datasets를 활용한 이진 분류 (binary classification)모델을 만드는 것을 목적으로 한다. IMDB Datasets info | Metadata | infomation |:----------|:----------:| |data_name | I

2023년 1월 11일
·
0개의 댓글
·