1교시: 김승준 강사님
2교시: 황소연 강사님
Hugging Face
머신 러닝을 위한 컴퓨팅
VM, Azure 머신 러닝 스튜디오 컴퓨트, 데이터 사이언스 가상 머신 비교
| 일반 Azure VM | Azure ML Compute | 데이터 사이언스 VM |
---|
목적 | 일반적인 컴퓨팅 작업 | 머신 러닝 전용 작업 | 데이터 사이언스 및 머신러닝 작업 |
사전 설치 도구 | 없음(사용자가 직접 설치) | Python, R 및 머신러닝 프레임워크 | 종합적인 데이터 사이언스 도구세트 |
관리 방식 | 사용자 관리 | Azure ML에서 완전 관리 | 사용자 관리 |
확장성 | 수동 확장 | 자동 확장 옵션 | 자동 확장 옵션 |
비용 | 사용 시간 또는 작업 시간에 따라 비용 지불 | 사용 시간 또는 작업 시간에 따라 비용 지불 | 사용 시간 또는 작업 시간에 따라 비용 지불 |
설치 시간 | 시간이 더 걸림(사용자 정의 필요) | 빠름(사전 구성됨) | 빠름(사전 구성됨) |
운영체제 지원 | Windows, Linux | Ubuntu | Windows, Ubuntu |
Jupyter Notebook 지원 | 수동 설정 필요 | 내장 | 사전 설치 |
Hugging Face의 역사와 산업 영향
Hugging Face의 역사
Hugging Face는 2016년에 설립된 인공지능 전문 회사로, 인공지능 기술의 발전을 선도하고 있다.
Hugging Face 주요 마일스톤
- 2016년 설립: AI 기반 챗봇 애플리케이션을 개발하기 위해 설립됨.
- 2019년: Transformers 라이브러리 출시. 다양한 자연어 처리(NLP) 모델을 오픈소스로 공개하여 사용자가 쉽게 이용할 수 있게 함.
- 2020년: Transformer v2.0 및 PyTorch, TensorFlow 간의 상호운용성 강화.
- 2021년
- Accelerate와 Optimum 출시. AI 모델 학습을 가속화하고 하드웨어 최적화를 지원.
- Gradio 인수 및 Hugging Face Spaces 출시. 사용자 친화적인 인터페이스로 모델 테스트 및 공유 가능.
- 2022년: Diffusers 라이브러리 출시. 이미지 생성 모델을 포함한 다양한 생성적 모델 지원.
- 2022-2023년: 시리즈 C 및 D 투자 라운드에서 약 1억 달러 이상의 자금을 유치.
- 2023년
- OpenAI 및 Microsoft와 협력하여 ChatGPT와 같은 모델을 Azure에서 지원.
- BigCode 프로젝트 시작, 코드 생성 모델 개발.
Hugging Face의 혁신과 커뮤니티
- 오픈 소스 접근: 누구나 사용하고 기여할 수 있는 오픈 소스 모델을 통해 AI 기술의 접근성을 높임.
- Transformers 라이브러리: 사전 훈련된 모델과 다양한 NLP 태스크를 지원하며, 사용자 친화적인 API 제공.
- 모델 배포의 용이성: Hugging Face Hub와 Inference API를 통해 모델을 쉽게 배포하고 사용할 수 있도록 지원.
- 다중 모달 지원: 텍스트, 이미지, 음성을 동시에 처리할 수 있는 기능을 제공.
- 강력한 커뮤니티: 다양한 개발자와 연구자들이 참여하여 지식 공유와 협업을 촉진.
Hugging Face의 생태계
- 핵심 서비스
- 모델: 사전 훈련된 머신 러닝 모델
- 데이터셋: 다양한 머신 러닝 작업을 위한 커뮤니티 큐레이션 데이터셋.
- 스페이스: ML 애플리케이션을 구축하고 호스팅할 수 있는 공간.
- 데이터셋
- Hugging Face Hub는 번역, 자동음성 인식, 이미지 분류 등 다양한 작업을 위한 데이터셋을 호스팅한다.
- 데이터셋 카드는 데이터셋의 내용을 이해하고 사용하는 데 도움을 준다.
- 스페이스
- Hugging Face Spaces는 ML 기반 데모를 쉽게 생성하고 배포할 수 있도록 도와준다.
- 사용자는 다양한 템플릿을 통해 환경을 쉽게 구성할 수 있다.
Responsible AI
책임 있는 인공지능(Responsible AI) 이란, 인공지능 기술이 사람에게 해를 끼치지 않고, 사회적, 윤리적으로 올바르게 사용되도록 만드는 것을 말한다.
왜 중요한가?
자율 주행 자동차, 의료 진단, 추천 시스템 등 이미 여러 분야에서 AI가 활용되고 있는데, AI가 편향되거나 잘못된 결정을 내리면, 사람들에게 큰 피해를 줄 수 있으므로, AI는 공정하고, 투명하며, 안전하게 사용되어야 한다.
핵심 요소
- 투명성: AI가 어떻게 결정을 내리는지 이해할 수 있어야 한다.
- 공정성: AI가 차별하지 않아야 한다. 데이터에 편향이 있으면 AI도 편향된 결과를 낼 수 있으므로, 공정한 데이터를 사용하고, AI가 공평하게 작동하는지 확인해야 한다.
- 안전성: AI가 실수로 해를 끼치지 않도록 해야 한다. 자율 주행 자동차나 의료 AI는 사람의 생명에 직접적인 영향을 미칠 수 있으므로, 철저하게 검증되고 안전하게 설계되어야 한다.
- 책임성: AI가 잘못된 결정을 내렸을 때, 그 책임을 누구에게 묻고, 어떻게 개선할지를 분명히 해야 한다.
Personal Insight
몸이 많이 아파서 오늘은 집중하기 어려웠다. 그래도 끝까지 수업에 참여할 수 있었던 것에 감사. Velog에 간단하게나마 복습하며 내용 정리 할 수 있어서 감사.
어려운 상황에서도 학습할 수 있는 기회가 허락됨에 감사. 다음주에는 더 좋은 컨디션으로 참여할 수 있었으면 좋겠다.