19일차 강의 : 허깅 페이스 (Hugging Face)

Luis_J·2024년 10월 4일
0

MS_AI_School 5기

목록 보기
18/48
post-thumbnail
post-custom-banner

Summary

허깅 페이스를 통해 AI에 쉽게 접근할 수 있습니다.

Introduction

김승준 강사님

허깅 페이스(Hugging Face)는 자연어 처리(NLP)를 포함한 다양한 인공지능(AI) 모델을 개발하고 배포하는 데 중점을 둔 회사이자 오픈소스 커뮤니티 플랫폼입니다.

허깅 페이스는 특히 Transformer라는 AI 모델을 기반으로 한 도구들을 제공하며, 이 기술은 많은 AI 애플리케이션에서 사용됩니다.

Code, Conept & Explanation

History of Hugging Face & Industry Impact

Hugging face의 역사

마이크로소프트, 구글, 아마존과 협업
이미지계의 깃허브
transformers library 를 release 하면서 유명해짐
Model Hub 보유, 깃허브와 같은 맥락

깃허브 모델스

개발자 관점에서 강점
playground
허깅 페이스와 매우 유사한 서비스 준비중

장점 : 원래 깃허브와 연동, 한 번에 잘 할 수 있음,

오픈 소스 approach
접근성, 협업과 혁신

Transformers Library

자연어 처리(NLP) 및 기타 AI 작업을 위한 강력한 도구
오늘날 Hugging Face가 있게 만든 시작

Transformer 들이 유사하게 다양해서 복수의 s붙여서 표현

  1. 사전 훈련된 모델
  2. 사용자 친화적인 인터페이스
  3. 다양한 태스크 지원 : 다양한 NLP 태스크 지원
  4. 다양한 프레임워크 지원
  5. 모델 커스터마이징
  6. 문서화 및 튜토리얼
  7. 커뮤니티 기여

What is Transformer?

"Attention Is All You Need" by Google
RNN 기반에서 Attenion 기반으로 변경

Easy of Model Deployment

AI 모델 배포를 간소화하여 개발자들이 쉽게 사용할 수 있도록 제공
과거의 코딩은 수공업
자동차를 만든다면, 엔진, 바퀴, 도색 모두 직접 만들기, 호환도 어려웠음

하지만 지금은 다 되어 있는 것을 사용
호환 용이

코어 개발은 물론 데이터 스트럭처, 알고리즘 모두 알아야 함

Multi-Modal Support

허깅 페이스 뿐만 아니라 다른 곳에서도 많이 사용

Thriving Community

강력하고 활발한 커뮤니티를 형성
AI 연구자와 개발자 간의 협업과 지식 공유 촉진

Latest Innovations

  1. Diffusers 라이브러리
  2. Hugging Face Spaces

허깅 페이스 스페이스는 깃허브 스페이스와 달리
개발 환경이 아니라 실행 화면
(깃허브 스페이스 : 개발 환경
허깅 페이스 스페이스 : 실행 화면)

현대의 인공지능은 데이터 사이언스와 굉장히 유사

데이터 사이언티스트 : 주로 모델을 만드는 역할, 엔진에 집중
데이터 엔지니어 : 데이터를 수집하고 관리하며, 데이터 분석을 위한 시스템을 구축하고 유지하는 데 중점

허깅 페이스의 핵심 서비스

  1. 데이터셋 (Datasets)
  2. 모델스 (Models)
  3. 스페이시스 (Spaces)

그라디오 (Gradio) : 머신러닝에 특화
스트림릿 (Streamlit) : 데이터분석에 특화

Depth Estimation

깊이 추정은 이미지에 존재하는 물체들의 깊이를 예측하는 작업

Image Classification

이미지 분류는 전체 이미지 레이블 또는 클래스를 할당하는 작업

Image Feature Extraction

이미지 특징 추출은 컴퓨터 비전 모델에서 학습한 특징을 추출하는 작업

Transfer Learning 전이 학습
수학, 과학 잘하는 학생이 영어, 과학도 잘한다

유사성
두 이미지 간의 유사성을 감지하는 데 사용

실행하기 위해서는 컴퓨팅을 사용해야 하는데, 비용을 지불해야 제대로 돌아가는 컴퓨팅 사용 가능

Image Segmentation

이미지를 세그먼트로 나누어 이미지의 각 픽셀을 객체에 매핑하는 작업

semantic : 의미로 구분
instance : 개별 객체 분리
팬옵틱 : 인스턴스와 클래스로 이미지를 세그먼트

Image-to-Image

입력 이미지를 다양한 조작 및 향상을 통해 변환하는 작업

Image-to-Text

이미지 캡셔닝 : 이미지의 텍스트 설명을 생성하는 과정
광학 문자 인식 (OCR) : 이미지에 존재하는 텍스트를 텍스트로 변환

Keypoint Detection

키포인트 감지는 이미지에서 의미 있는 독특한 점이나 특징을 식별하는 작업

포즈 추정
얼굴 랜드마크 추정
피트니스 추적, 스포츠 분석

Token Classification

커스컴은 내 정보를 추가 학습

NER 개체명 인식
PoS 품사 태깅

송장 정보 추출

Tabular

통계 기반 데이터 분석을 쉽게 표현

Tabular Classification

탭형 분류는 속성 집합을 기반으로 목표 그룹을 분류하는 작업

Tabular Regression

회귀 분석
탭형 회귀는 주어진 속성 집합을 기반으로 숫자 값을 예측하는 작업

Challenges & Solutions

Results

What I Learned & Insights

맨 땅에 해딩하는 것이 아니라
이미 검증되고 유용한 AI 관련 툴들을 활용해야 합니다.

먼저 고민한 선배들 수준에서 시작할 수 있도록
평상시 꾸준히 성실하게 학습해야 합니다.

Conclusion

허깅 페이스 플랫폼을 활용하여 AI를 쉽게 구현할 수 있습니다.

profile
New life & History
post-custom-banner

0개의 댓글