[기업] NVIDIA와 GPU 이야기

서쿠·2024년 7월 25일
1

IT지식

목록 보기
6/12
post-thumbnail

NVIDIA와 GPU 이야기

딥러닝, LLM, ChatGPT 등 이제는 인공지능 하면 GPU를 빼놓고 얘기할 수 없습니다.

현재 순위권에서 좀 밀려난 모델들이긴하지만, 이러한 LM(대형언어모델, Language Model) 역시 GPU (Graphics Processing Unit)로 학습된 것을 확인할 수 있습니다.

GPU란, 원래 그래픽 처리를 위해 설계된 프로세서입니다. 하지만 현재는 그 용도가 확장되어 다양한 분야에서 활용되고 있습니다. 한때 비트코인 채굴로도 큰 열풍을 불러오기도 했으며, 현재는 AI/딥러닝 학습용으로 많이 쓰이고 있죠 😎

물론! TPU도 있긴합니다만...!
TPU (Tensor Processing Unit)는 Google이 기계 학습 작업을 가속화하기 위해 특별히 개발한 프로세서로써, 이번에 다루고 싶은 주제와는 조큼 다르기 때문에 살짝 옆으로 비켜두도록 하겠습니다.

최근 인공지능(AI, Artificial Intelligence) 시장의 붐으로 엔비디아가 빛을 봤습니다. 이번 포스트에서는 엔비디아의 역사에 대해서 가볍게 살펴보도록 하겠습니다 😄

1. 엔비디아의 설립과 초기 도전

설립 배경

1993년, 젠슨 황(Jensen Huang), 크리스 말라초프스키(Chris Malachowsky), 커티스 프리엠(Curtis Priem)이라는 세 명의 엔지니어는 컴퓨터 그래픽이 미래의 컴퓨터 산업을 주도할 것이라는 확신 아래 엔비디아를 설립했습니다. 이들은 초기부터 비주얼 컴퓨팅(Visual Computing)의 중요성을 강조하며, 이를 실현하기 위한 기술 개발에 몰두했습니다.

NV1: 첫 도전과 실패의 교훈

엔비디아의 첫 번째 제품인 NV1은 1995년에 출시되었습니다. 이 제품은 2D와 3D 그래픽 가속 기능을 동시에 제공하는 혁신적인 칩셋이었지만, 상업적으로는 큰 성공을 거두지 못했습니다. NV1의 실패는 엔비디아에게 컴퓨터 그래픽 기술의 복잡성과 시장의 요구를 깊이 이해할 필요성을 일깨워주는 중요한 교훈이 되었습니다. 젠슨 황은 이 실패를 발판 삼아 더욱 혁신적인 기술 개발에 집중하게 됩니다.

2. GeForce 시리즈: GPU의 탄생과 진화

GeForce 256: 세계 최초의 GPU

1999년, 엔비디아는 세계 최초의 GPU(그래픽 처리 장치)인 GeForce 256을 출시했습니다. 이 제품은 하드웨어 T&L(Transform & Lighting)을 지원하며, 그래픽 처리 속도와 효율성에서 획기적인 도약을 이루었습니다. GeForce 256은 게임 산업과 멀티미디어 응용 프로그램에서 필수적인 요소로 자리 잡으며, 엔비디아를 컴퓨터 그래픽 업계의 선두주자로 자리매김하게 했습니다.

GeForce 시리즈의 진화

1999년 NVIDIA는 첫 번째 GeForce 그래픽 카드인 GeForce 256을 출시하며 그래픽 카드 시장에 큰 변화를 가져왔습니다. 이후 GeForce 시리즈는 매 세대마다 성능과 전력 효율성을 크게 향상시키며 진화해 왔습니다.

  1. 초기 세대 (1999-2002):

    • GeForce 256부터 GeForce 4 시리즈까지는 그래픽 처리 능력이 점점 더 좋아졌습니다. 특히, GeForce 3GeForce 4는 새로운 기술을 도입해 3D 그래픽의 품질을 크게 개선했습니다. 이로 인해 게임 그래픽이 훨씬 더 생동감 있게 표현될 수 있었습니다.
  2. DirectX 9 시대 (2003-2004):

    • GeForce FX 시리즈는 DirectX 9.0을 지원하면서, 더 나은 그래픽을 표현할 수 있었습니다. 새로운 기술 덕분에 게임 속 그래픽이 더욱 복잡하고 사실적으로 표현되기 시작했습니다.
  3. 멀티 GPU 기술 도입 (2004-2006):

    • GeForce 6 시리즈부터는 SLI(SLI는 Scalable Link Interface의 약자입니다) 기술을 도입하여, 여러 개의 그래픽 카드를 동시에 사용해 성능을 높일 수 있게 되었습니다. 이 기술은 고해상도에서 게임을 즐기거나, 그래픽 작업을 할 때 큰 도움이 되었습니다.
  4. 통합 셰이더 아키텍처 (2006-2010):

    • GeForce 8 시리즈는 그래픽 처리의 중요한 변화를 가져왔습니다. 이 시리즈에서는 다양한 그래픽 작업을 하나의 유닛으로 처리할 수 있는 통합 셰이더 아키텍처를 도입했습니다. 이 덕분에 그래픽 카드는 더 다양한 작업을 더 빠르고 효율적으로 처리할 수 있었습니다.
  5. Fermi 아키텍처와 멀티코어 기술 (2010-2011):

    • GeForce 400 시리즈와 500 시리즈는 NVIDIA의 Fermi 아키텍처를 기반으로 개발되었습니다. 이 시리즈는 다수의 코어를 통해 여러 작업을 동시에 처리할 수 있게 되어, 과학 계산이나 데이터 분석처럼 복잡한 연산이 필요한 작업에도 사용되기 시작했습니다.
  6. Kepler 아키텍처와 전력 효율성의 향상 (2012-2014):

    • GeForce 600 시리즈와 700 시리즈는 Kepler 아키텍처를 바탕으로 만들어졌습니다. 이 시리즈는 성능을 유지하면서도 전력 소비를 크게 줄여, 더 적은 전력으로 더 강력한 성능을 낼 수 있었습니다. 또한, 여러 개의 모니터를 연결해 게임을 즐길 수 있는 기능도 지원되었습니다.
  7. Maxwell 아키텍처와 고성능 표준화 (2014-2016):

    • GeForce 900 시리즈는 Maxwell 아키텍처를 기반으로 개발되었으며, 성능은 높이고 전력 소비는 낮추는 데 중점을 두었습니다. 이 시리즈는 특히 가상 현실(VR) 환경에서도 잘 작동하며, 4K 해상도에서도 뛰어난 성능을 발휘할 수 있었습니다.
  8. Pascal 아키텍처와 VR 및 4K 게임 대중화 (2016-2018):

    • GeForce 10 시리즈는 Pascal 아키텍처를 기반으로 개발되었으며, VR과 4K 게임을 일반 대중에게 널리 보급하는 데 중요한 역할을 했습니다. 이 시리즈는 더 작은 칩으로도 강력한 성능을 발휘할 수 있게 했고, AI와 머신러닝 같은 복잡한 작업에도 뛰어난 성능을 보였습니다.
  9. RTX와 Turing 아키텍처의 도입 (2018-2020):

    • GeForce 20 시리즈는 Turing 아키텍처를 기반으로 한 새로운 RTX 브랜드를 선보였습니다. RTX 시리즈는 실시간 레이 트레이싱 기술을 통해, 빛과 그림자를 더 사실적으로 표현할 수 있었습니다. 이 시리즈는 또한 AI 기술을 활용해 게임 그래픽의 품질을 높이고, 성능을 더욱 강화했습니다.
  10. Ampere 아키텍처와 성능의 극대화 (2020-2022):

    • GeForce 30 시리즈는 Ampere 아키텍처로 개발되었으며, RTX 기술을 한 단계 더 발전시켰습니다. 이 시리즈는 이전 세대보다 두 배 이상의 성능을 제공하면서도 전력 소비를 줄였으며, 4K 해상도에서도 놀라운 성능을 자랑했습니다.
  11. Ada Lovelace 아키텍처와 차세대 그래픽 (2022-현재):

    • GeForce 40 시리즈는 Ada Lovelace 아키텍처를 기반으로 만들어졌습니다. 이 시리즈는 더 발전된 레이 트레이싱과 AI 기술을 통해, 이전 세대보다 훨씬 더 뛰어난 그래픽을 제공합니다. 최신 RTX 4090과 4080은 8K 해상도에서도 매우 높은 성능을 발휘하며, 게임뿐만 아니라 다양한 콘텐츠 제작에서도 중요한 역할을 하고 있습니다.

CUDA와 AI로의 확장

2006년에 등장한 GeForce 8 시리즈는 CUDA(Compute Unified Device Architecture) 기술을 도입해, GPU를 그래픽 처리뿐만 아니라 범용 연산(GPGPU)으로도 활용할 수 있게 했습니다. 이 기술은 과학적 연산, 금융 모델링, 데이터 분석, 그리고 특히 딥러닝과 같은 AI 작업에서 GPU를 사용 가능하게 만들었습니다.

CUDA의 도입은 GPU가 단순히 그래픽 렌더링 장치에서 벗어나, 범용 컴퓨팅에서 중요한 역할을 하게 되는 전환점을 마련했습니다. 이후 출시된 GeForce 시리즈들은 이러한 범용 연산 능력을 더욱 강화하여, AI와 머신러닝, 그리고 다양한 고성능 컴퓨팅 응용 분야에서 핵심 도구로 자리 잡게 되었습니다.

GPU 모델 번호의 숨겨진 의미

NVIDIA의 그래픽 카드 모델 번호는 제품의 세대와 성능 등급을 나타내는 중요한 정보를 담고 있습니다. 예를 들어 RTX 3080RTX 3090의 숫자들은 각각 다음과 같은 의미를 가지고 있습니다.

1. 앞 두 자리 숫자: 세대(GPU 시리즈)

  • "30" 부분은 해당 그래픽 카드가 30시리즈에 속한다는 것을 의미합니다.
  • NVIDIA는 세대별로 새로운 기술과 성능 향상을 도입하며, 각 세대는 연속적인 숫자로 표시됩니다.
    • 예시:
      • 10시리즈 (예: GTX 1080): Pascal 아키텍처 기반
      • 20시리즈 (예: RTX 2080): Turing 아키텍처 기반, 레이 트레이싱 최초 도입
      • 30시리즈 (예: RTX 3080): Ampere 아키텍처 기반, 레이 트레이싱 및 DLSS 성능 향상
      • 40시리즈 (예: RTX 4080): Ada Lovelace 아키텍처 기반, 최신 기술 적용

2. 뒤 두 자리 숫자: 성능 등급

  • "80"이나 "90"과 같은 숫자는 해당 세대 내에서의 성능 등급을 나타냅니다.
  • 일반적으로 숫자가 높을수록 더 높은 성능과 고사양을 제공하며, 이에 따라 가격도 상승합니다.
    • 등급별 의미:
      • "90" 등급: 최상위 플래그십 모델로, 최고 수준의 성능과 기능을 제공합니다.
        • 예: RTX 3090, RTX 4090
      • "80" 등급: 상위 모델로, 고해상도 게이밍과 전문 작업에 적합한 높은 성능을 제공합니다.
        • 예: RTX 3080, RTX 4080
      • "70" 등급: 중상위 모델로, 가격 대비 우수한 성능을 제공하여 많은 게이머들에게 인기 있습니다.
        • 예: RTX 3070, RTX 4070
      • "60" 등급: 중급 모델로, 합리적인 가격에 준수한 성능을 제공합니다.
        • 예: RTX 3060, RTX 4060
      • "50" 등급: 보급형 모델로, 가벼운 게이밍과 일반적인 컴퓨팅 작업에 적합합니다.
        • 예: GTX 1050, RTX 2050

3. 추가 문자: 성능 및 기능의 세부 구분

  • 모델 번호 뒤에 붙는 Ti, SUPER, Ultra 등의 문자는 기존 모델의 강화 버전임을 나타냅니다.
    • "Ti" (Titanium): 기본 모델보다 약간 향상된 성능을 제공합니다.
      • 예: RTX 3080 Ti는 RTX 3080보다 높은 성능을 가집니다.
    • "SUPER": 성능과 기능이 업그레이드된 모델을 의미합니다.
      • 예: RTX 2060 SUPER는 RTX 2060보다 개선된 성능을 제공합니다.

예시

  • RTX 3080

    • "30": 30시리즈, 즉 Ampere 아키텍처 기반의 세대
    • "80": 상위 성능 등급으로, 고사양 게이밍과 전문 작업에 적합
  • RTX 3090

    • "30": 30시리즈, Ampere 아키텍처 기반
    • "90": 최상위 성능 등급으로, 최고의 퍼포먼스를 요구하는 작업에 최적

3. Quadro 시리즈: 전문 그래픽 솔루션의 표준

전문 워크스테이션을 위한 Quadro

2000년, 엔비디아는 전문 그래픽 작업을 위한 Quadro 시리즈를 출시했습니다. Quadro GPU는 CAD(Computer-Aided Design), DCC(Digital Content Creation), 의료 영상 등의 분야에서 사용되며, 높은 정밀도와 안정성을 요구하는 작업 환경에 최적화되어 있습니다. Quadro 시리즈는 그래픽 디자이너와 엔지니어들 사이에서 표준 도구로 자리 잡았습니다.

4. Tesla와 V100: AI와 고성능 컴퓨팅의 핵심

Tesla 시리즈의 시작

2007년, 엔비디아는 고성능 컴퓨팅(HPC)과 데이터 센터를 위한 Tesla 시리즈를 발표했습니다. Tesla GPU는 대규모 데이터 처리와 연산에 최적화되어 있으며, 특히 AI 연구와 딥러닝 모델의 학습에서 큰 성과를 거두었습니다.

V100과 AI의 발전

Tesla 시리즈의 최신 모델인 Tesla V100은 2017년에 출시되었으며, 볼타(Volta) 아키텍처를 기반으로 합니다. V100은 AI와 딥러닝 작업에 최적화된 성능을 제공하며, 대규모 병렬 처리 능력을 갖추고 있어 AI 모델 학습 속도를 비약적으로 향상시킬 수 있습니다. 이는 AI 연구자들과 데이터 과학자들에게 필수적인 도구가 되었습니다.

5. Tegra와 Jetson: 임베디드 시스템과 자율주행을 위한 기술

모바일과 임베디드 시스템을 위한 Tegra

2008년, 엔비디아는 모바일 장치와 임베디드 시스템을 위한 SoC(System on a Chip)인 Tegra 시리즈를 출시했습니다. Tegra는 휴대용 게임 콘솔, 스마트폰, 드론, 그리고 자동차 등에 사용되며, 강력한 그래픽 성능과 에너지 효율성을 제공합니다.

Jetson 시리즈: AI와 로보틱스의 핵심

2014년, 엔비디아는 AI 및 로보틱스 응용 프로그램을 위한 임베디드 컴퓨팅 플랫폼인 Jetson 시리즈를 출시했습니다. Jetson은 자율주행차, 드론, AIoT(Artificial Intelligence of Things) 기기 등의 핵심 기술로 사용되며, 실시간 AI 연산과 높은 에너지 효율성을 동시에 제공합니다.

6. 엔비디아의 현재와 미래

AI 및 LLM 시장에서의 지배력

엔비디아는 현재 AI 칩 시장에서 70%에서 95% 사이의 점유율을 보유하고 있습니다. 이러한 지배력은 H100과 같은 플래그십 AI GPU와 CUDA 소프트웨어에 기반하고 있습니다. 2023년 엔비디아의 AI 칩 매출은 약 345억 달러로 추정되며, 이는 전체 AI 칩 시장이 향후 5년 내에 연간 4000억 달러 규모로 성장할 것이라는 전망의 일부를 차지합니다.

차세대 GPU 아키텍처

2024년 GTC에서 발표된 Blackwell GPU는 엔비디아의 미래 전략을 보여줍니다. Blackwell은 생성형 AI 시대를 위한 프로세서로 포지셔닝되어 있으며, 최대 10조 개의 매개변수를 가진 대규모 언어 모델의 학습과 추론을 가능하게 합니다. 이는 엔비디아가 AI 및 고성능 컴퓨팅 분야에서 계속해서 혁신을 주도하려는 의지를 보여줍니다.

AI 서비스 및 마이크로서비스 확장

엔비디아는 단순한 칩 제공업체에서 플랫폼 제공업체로 전환하고 있습니다. Nvidia Inference Microservice (NIM)와 같은 도구의 도입은 AI 모델 배포를 간소화하고, 기업들이 더 쉽게 AI를 활용할 수 있게 합니다. 이는 엔비디아가 AI 생태계 전반에 걸쳐 더 큰 역할을 하려는 전략의 일환입니다.

경쟁과 도전

엔비디아의 지배적 위치에도 불구하고, AMD, Intel, 그리고 여러 스타트업들이 AI 칩 시장에서 경쟁력을 키우고 있습니다. 또한, 아마존, 구글, 마이크로소프트와 같은 주요 클라우드 제공업체들이 자체 AI 칩을 개발하고 있어, 엔비디아에게는 도전이 될 수 있습니다.

미래 방향성

  1. AI 슈퍼컴퓨터 개발: 엔비디아는 국가 단위의 AI 연구 및 개발을 위한 고성능 AI 슈퍼컴퓨터 구축에 주력하고 있습니다.

  2. 양자 컴퓨팅 시뮬레이션: 전통적인 AI 슈퍼컴퓨터를 사용한 양자 컴퓨팅 시뮬레이션 연구를 확대할 전망입니다.

  3. 비주얼 생성형 AI: NVIDIA Research 팀은 이미지, 비디오, 3D 환경을 생성하고 해석하는 새로운 기술 개발에 집중하고 있습니다.

  4. 자율주행 및 스마트 시티: 자율주행 자동차와 스마트 시티 관련 연구에 지속적으로 투자하고 있습니다.

결론

엔비디아는 AI와 고성능 컴퓨팅 분야에서 선도적인 위치를 유지하고 있으며, Blackwell GPU와 같은 혁신적인 제품을 통해 이 위치를 강화하고 있습니다. 동시에 AI 서비스 및 마이크로서비스로의 확장을 통해 더 넓은 시장을 공략하고 있습니다. 그러나 경쟁이 심화되고 있는 만큼, 엔비디아의 미래 성공은 지속적인 기술 혁신과 시장 요구에 대한 빠른 대응 능력에 달려 있을 것입니다. 양자 컴퓨팅, 비주얼 AI, 자율주행 등 다양한 분야에서의 연구 개발을 통해 엔비디아는 AI 기술의 미래를 계속해서 형성해 나갈 것으로 보입니다.

profile
Always be passionate ✨

0개의 댓글