Veo2: 차세대 AI 비디오 생성 모델 (Veo2 vs Sora)

서쿠·2024년 12월 30일
3

Veo2: 차세대 AI 비디오 생성 모델

구글 딥마인드가 개발한 Veo2는 텍스트 프롬프트나 참조 이미지를 기반으로 고품질 비디오를 생성할 수 있는 최첨단 AI 모델입니다. 현재 Veo2는 베타 테스터에게만 공개되어 있으며, 향후 버텍스 AI(Developer Platform)에 도입될 예정입니다. 이 모델은 사용자들에게 혁신적인 창작 도구를 제공하며, 영상 제작의 새로운 가능성을 열고 있습니다.

저도 베타 테스트를 신청했지만, 아직 선정 소식이 없어 아쉬워하고 있던 차에 제가 즐겨 구독하는 유튜버 김그륜(링크)님께서 베타 테스터로 선정되셨다는 소식을 접했습니다. 그륜님의 상세한 후기 덕분에 이렇게 Veo2 관련 포스트를 작성할 수 있게 되었습니다!

그륜님의 리뷰를 소개해드리기 전에 Veo2 소개 및 특징들을 짚고 넘어가겠습니다!

Veo2 소개 및 주요 특징

Veo2는 Google DeepMind에서 개발한 차세대 AI 비디오 생성 모델로, 텍스트 프롬프트와 참조 이미지를 입력으로 받아 고품질의 비디오를 자동으로 생성합니다. Veo2는 비디오 제작의 혁신을 선도하며, 기존 방식에서 소요되는 시간과 비용을 획기적으로 줄이는 데 기여합니다. 현재 베타 테스트 중이며, Google Vertex AI 플랫폼에 통합될 예정입니다.

Google Vertex AI
Google Vertex AI는 Google Cloud Platform에서 제공하는 통합 머신러닝 플랫폼입니다. 이 플랫폼은 데이터 과학자와 ML 엔지니어가 머신러닝 모델을 빠르게 구축, 배포, 확장할 수 있도록 설계되었습니다.

  • Vertex AI는 AutoML과 AI Platform을 포함한 Google Cloud의 다양한 ML 서비스를 하나의 통합된 플랫폼으로 제공합니다. 이를 통해 사용자는 데이터 준비부터 모델 배포까지 전체 ML 워크플로를 관리할 수 있습니다.

Veo2는 디지털 마케팅, 교육 콘텐츠 제작, 창작 분야에서 큰 잠재력을 보이며, 텍스트 기반 콘텐츠 생성 모델의 새로운 기준을 제시합니다. 이 모델은 OpenAI의 DALL-E와 유사하게 동작하지만, 비디오 시퀀스 생성에 특화되어 시간적 요소를 다루는 데 뛰어난 성능을 자랑합니다.


Veo2의 주요 특징

1. 고해상도와 세부 품질

이미지 출처 : https://deepmind.google/technologies/veo/veo-2/

  • Veo2는 최대 4K 해상도(4096×2160)의 비디오를 생성하며, 사실적이고 세밀한 결과물을 제공합니다.
  • 이전 모델에 비해 디테일과 사실성 면에서 크게 개선되었으며, 고해상도 디스플레이 환경에서도 뛰어난 품질을 유지합니다.
  • 픽셀 단위의 세부 표현이 가능하여 전문가 수준의 영상 제작을 지원합니다.

2. 물리적 현실감

이미지 출처 : https://deepmind.google/technologies/veo/veo-2/

  • 실제 물리학을 기반으로 한 시뮬레이션으로 자연스러운 움직임현실적인 장면을 생성합니다.
  • 중력, 유체 동역학, 물체의 상호작용 등의 표현이 정교하여 다양한 환경을 사실적으로 재현할 수 있습니다.
  • 이는 자연환경, 스포츠, 복잡한 기계 작동 등 사실성이 요구되는 프로젝트에서 강점을 발휘합니다.

3. 다양한 스타일링 지원

이미지 출처 : https://deepmind.google/technologies/veo/veo-2/

  • 포토리얼리즘, 인상주의, 애니메이션 등 다양한 스타일을 지원하여 창의적이고 독창적인 비디오 제작이 가능합니다.
  • 사용자 맞춤형 스타일링 옵션으로 프로젝트의 개성을 강조할 수 있습니다.
  • 애니메이션과 실사 스타일 간의 조화를 통해 독특한 시각적 효과를 연출할 수 있습니다.

4. 정교한 카메라 제어

  • 다양한 카메라 앵글, 움직임, 효과를 정밀하게 제어하여 영화 같은 표현을 제공합니다.
  • 초점 심도, 카메라 흔들림, 줌 등의 세부 설정을 통해 창의적이고 전문적인 비디오 제작이 가능합니다.
  • 광고, 뮤직비디오, 영화와 같은 고퀄리티 프로젝트에서 유용하게 활용됩니다.

5. 긴 비디오 생성

  • 최대 2분 길이의 비디오를 생성할 수 있어, OpenAI의 Sora보다 6배 긴 비디오 제작이 가능합니다.
  • 긴 시퀀스 제작이 가능하여 스토리 중심의 콘텐츠 제작에도 적합합니다.

Veo2의 사용 사례와 생성 예시 (Veo2 공식 예시)

길고 상세하게 작성해야 잘 만들어주는 것이 특징인 것 같더라고요! 👀 (오오오)

Veo2는 각 프롬프트를 통해 다양한 비주얼 스타일과 상황을 표현하며, 세부 디테일과 정교한 장면 구성을 통해 놀라운 비디오 생성 능력을 보여줍니다. 아래는 각 프롬프트의 주요 특징과 이를 통해 드러나는 Veo2의 강점입니다.

사례 1: 음악과 인물 중심의 시각적 연출

사례 1: 음악과 인물 중심의 시각적 연출

Sora 프롬프트 예시

프롬프트: 극단적인 클로즈업 샷은 여성 DJ의 얼굴에 초점을 맞추고, 그녀의 아름답고 볼륨 있는 검은 곱슬머리가 음악에 완전히 몰입한 그녀의 이목구비를 감싸고 있습니다. 그녀는 눈을 감고 리듬에 빠져 있으며 입술에는 살짝 미소를 짓고 있습니다. 카메라는 고개를 끄덕이고 비트에 맞춰 몸을 흔들며 헤드폰을 통해 관중석으로 울려 퍼지는 음악에 본능적으로 반응하는 그녀의 미묘한 머리의 움직임을 포착합니다. 얕은 피사계 심도로 배경이 흐릿해집니다. 그녀는 생생한 네온 컬러에 둘러싸여 있습니다. 클로즈업은 그녀의 매혹적인 존재감과 음악이 가진 이동과 초월의 힘을 강조합니다.

Prompt: An extreme close-up shot focuses on the face of a female DJ, her beautiful, voluminous black curly hair framing her features as she becomes completely absorbed in the music. Her eyes are closed, lost in the rhythm, and a slight smile plays on her lips. The camera captures the subtle movements of her head as she nods and sways to the beat, her body instinctively responding to the music pulsating through her headphones and out into the crowd. The shallow depth of field blurs the background. She’s surrounded by vibrant neon colors. The close-up emphasizes her captivating presence and the power of music to transport and transcend.

프롬프트 특징:
1. 클로즈업과 인물 중심: 극단적인 클로즈업 샷을 통해 인물의 표정과 감정에 초점을 맞춥니다. 이는 Veo2의 디테일한 얼굴 표현과 감정 전달 능력을 강조합니다.
2. 네온 컬러와 몰입감: 네온 조명과 음악에 몰입한 인물의 움직임은 현대적인 클럽 분위기와 음악의 에너지를 효과적으로 전달합니다.
3. 얕은 피사계 심도: 배경을 흐릿하게 처리하여 인물의 존재감을 강조하고 시각적 집중을 유도합니다.
4. 미세한 움직임 포착: 머리의 미묘한 움직임과 리듬에 맞춘 자연스러운 동작 표현이 가능합니다.

Veo2의 강점:

  • 정교한 감정 표현: 인물의 몰입감과 리듬에 따른 세부적인 움직임을 표현.
  • 복잡한 조명 연출: 네온 컬러와 같은 동적 조명 효과를 사실적으로 시뮬레이션.

사례 2: 고해상도 애니메이션 제작

사례 2: 고해상도 애니메이션 제작

Sora 프롬프트 예시

프롬프트: 얕은 피사계 심도의 이 미디엄 샷은 1980년대 부엌에 똑바로 앉아 있는 갈색 웨이브 머리의 귀여운 만화 소녀를 묘사합니다. 그녀의 머리카락은 중간 길이의 웨이브입니다. 작고 약간 위로 올라간 코와 작고 둥근 귀를 가지고 있습니다. 그녀는 카메라에 말을 걸면서 매우 생동감 있고 흥분된 표정을 짓고 있습니다.

Prompt: This medium shot, with a shallow depth of field, portrays a cute cartoon girl with wavy brown hair, sitting upright in a 1980s kitchen. Her hair is medium length and wavy. She has a small, slightly upturned nose, and small, rounded ears. She is very animated and excited as she talks to the camera.

프롬프트 특징:
1. 애니메이션 스타일: 1980년대 부엌 배경의 만화 캐릭터를 묘사하며 Veo2의 애니메이션 제작 능력을 시연합니다.
2. 얕은 피사계 심도: 배경 흐림 처리를 통해 인물의 생동감을 강조합니다.
3. 인물 디테일: 만화 캐릭터의 얼굴 형태와 표정을 정교하게 표현하여 애니메이션 제작에서의 활용성을 보여줍니다.

Veo2의 강점:

  • 스타일 전환 능력: 포토리얼리즘에서 애니메이션 스타일로 전환이 가능.
  • 생동감 있는 캐릭터 연출: 캐릭터의 표정과 움직임을 자연스럽게 구현.

사례 3: 음식 광고 연출

사례 3: 음식 광고 연출

Sora 프롬프트 예시

프롬프트: 완벽하게 차려진 아침 식사 장면 뒤로 해가 천천히 떠오릅니다. 폭신한 팬케이크 더미 위로 진한 황금빛 메이플 시럽이 슬로우 모션으로 쏟아지며 부드럽고 따뜻한 증기 구름을 내뿜습니다. 바삭한 베이컨이 지글지글 지글거리며 작은 황금빛 기름 불씨를 공중으로 날려 보내는 장면이 클로즈업됩니다. 투명한 컵에 커피가 부드럽게 소용돌이치듯 쏟아지며 진한 갈색의 크레마 층으로 채워집니다. 장면은 카메라가 갓 자른 오렌지를 향해 날아가면서 밝고 과즙이 가득한 오렌지 조각이 놀라운 매크로 디테일로 드러나면서 마무리됩니다.

Prompt: The sun rises slowly behind a perfectly plated breakfast scene. Thick, golden maple syrup pours in slow motion over a stack of fluffy pancakes, each one releasing a soft, warm steam cloud. A close-up of crispy bacon sizzles, sending tiny embers of golden grease into the air. Coffee pours in smooth, swirling motion into a crystal-clear cup, filling it with deep brown layers of crema. Scene ends with a camera swoop into a fresh-cut orange, revealing its bright, juicy segments in stunning macro detail.

프롬프트 특징:
1. 슬로우 모션: 팬케이크 위로 메이플 시럽이 흐르는 장면을 슬로우 모션으로 연출하여 디테일을 강조합니다.
2. 질감 표현: 증기, 기름 방울, 크레마 층 등의 세부적인 질감을 사실적으로 표현합니다.
3. 매크로 디테일: 오렌지 조각과 같은 작은 디테일을 극대화하여 생동감과 리얼리즘을 극대화합니다.
4. 따뜻한 조명: 아침 햇살과 같은 자연광을 활용하여 따뜻하고 포근한 분위기를 조성합니다.

Veo2의 강점:

  • 초미세 디테일: 음식 광고에서 요구되는 섬세한 표현 능력.
  • 조명과 질감 처리: 자연광과 텍스처를 사실적으로 재현.

사례 4: 도시 배경에서의 자동차 액션

사례 4: 도시 배경에서의 자동차 액션

Sora 프롬프트 예시

프롬프트: 로우 앵글 추적 촬영, 18mm 렌즈. 차가 드리프트하면서 빛과 타이어 연기의 흔적을 남기며 시각적으로 인상적이고 추상적인 구도를 만들어냅니다. 카메라는 낮은 각도로 추적하며 코너에 접근하는 매끈한 올리브 그린 머슬카를 포착합니다. 자동차가 극적인 드리프트를 실행할 때 샷은 더욱 스타일리시해집니다. 회전하는 바퀴와 피어오르는 타이어 연기가 주변의 도시 조명과 렌즈 플레어에 비춰져 어두운 아스팔트에 빛과 색의 줄무늬를 만들어냅니다. 노란색 택시, 네온사인, 보행자 등 도시 풍경은 흐릿하고 추상적인 배경이 됩니다. 볼류메트릭 조명은 깊이와 분위기를 더하여 장면을 모션, 빛, 도시 에너지가 시각적으로 인상적인 구성으로 바꾸어 줍니다.

Prompt: Low-angle tracking shot, 18mm lens. The car drifts, leaving trails of light and tire smoke, creating a visually striking and abstract composition. The camera tracks low, capturing the sleek, olive green muscle car as it approaches a corner. As the car executes a dramatic drift, the shot becomes more stylized. The spinning wheels and billowing tire smoke, illuminated by the surrounding city lights and lens flare, create streaks of light and color against the dark asphalt. The cityscape – yellow cabs, neon signs, and pedestrians – becomes a blurred, abstract backdrop. Volumetric lighting adds depth and atmosphere, transforming the scene into a visually striking composition of motion, light, and urban energy.

프롬프트 특징:
1. 로우 앵글과 동적 카메라: 낮은 각도에서 자동차를 따라가는 촬영으로 역동성을 강조합니다.
2. 볼류메트릭 조명: 도시의 네온 조명과 렌즈 플레어를 활용하여 장면에 깊이와 분위기를 더합니다.
3. 추상적 구성: 드리프트 중 발생하는 연기와 빛의 흔적이 추상적이고 시각적으로 인상적인 구도를 만듭니다.
4. 도시의 에너지: 배경의 흐릿한 도시 풍경이 장면에 생동감을 더합니다.

Veo2의 강점:

  • 역동적 장면 구현: 자동차의 속도감과 동작을 세밀하게 표현.
  • 복잡한 조명 연출: 다양한 조명 효과를 활용하여 도시의 생동감을 극대화.

Veo2의 예시 프롬프트 특징

위 사례들은 Veo2가 가진 폭넓은 활용 가능성과 최첨단 기술력을 보여주는 대표적인 예시입니다.

  1. 세부 디테일 강조: 인물, 음식, 자동차 등 다양한 프롬프트에서 작은 디테일까지 충실히 표현.
  2. 스타일 다양성: 포토리얼리즘, 애니메이션, 광고 스타일 등 여러 시각적 요구를 충족.
  3. 물리적 현실감: 슬로우 모션, 조명 반사, 움직임 등 물리적 사실성을 강화.
  4. 창의적 연출 가능: 복잡한 장면 구성과 조명 효과를 활용하여 독창적인 결과물 제작 가능.

Veo2의 장점과 활용성을 한눈에 이해할 수 있는 유용한 프롬프트들입니다. 위와 같이 프롬프트를 작성하면 어느정도 고-퀄리티의 결과물이 나오는 것을 확인할 수 있습니다.


유튜버 김그륜 후기 및 실험 결과

  • 유튜버 김그륜님은 헐리우드에서 활동하는 한국인 모션 그래픽 디자이너이자 유튜버입니다. 엄청나신 분이시더라고요. (매번 CJ ENM 영화 보면 나오는 FILM Logo Animation도 그륜님 작품 ㄷㄷㄷ)

출처 : 김그륜님 포트폴리오

Veo2 후기

  • Veo2는 고양이의 움직임, 물 시뮬레이션, 다양한 재질 표현 등 현실적인 시뮬레이션에서 탁월한 성능을 발휘합니다.
  • 예를 들어, 고양이가 물속에서 고무공을 가지고 노는 장면은 물의 기포와 고양이 털의 표현까지 자연스럽게 구현되었습니다.
  • 상업용 영상 제작자와 개인 창작자 모두 Veo2의 효율성과 품질에 대해 찬사를 보냈습니다.

실험 사례

(참고사항)

  • 아래 영문 프롬프트 예시는 제가 임의로 프롬프트를 쓴 것이기 때문에 그륜님께서 하신 정도의 퀄리티가 나오려면 좀 더 길고 자세하게 묘사해야 합니다.
  • 아래 첨부한 이미지들은 그륜님께서 Veo2 베타테스터로 선정되신 뒤에 만드신 영상 캡쳐 이미지 자료입니다.
  • 이미지 출처 : AI로 만든 영상이라곤 진짜 믿을 수 없는... Veo2 직접 사용해 본 후기!
  1. 프레스기 실험:

    • 단단한 물체(예: 대리석, 유리)의 압력에 따른 깨짐과 구부러짐을 자연스럽게 표현.
    • 고무 오리 인형이 프레스기로 눌렸을 때 내부의 물이 튀어나오는 장면까지 사실적으로 구현.

    프롬프트 예시:

    • "A rubber duck being pressed by a hydraulic press, with water squirting out naturally."

  1. 창의적인 표현:

    • 선글라스를 쓴 고양이가 도심에서 스케이트를 타는 장면과 같은 독창적이고 현실감 있는 장면을 손쉽게 생성.
    • 얼음 위에 불이 붙는 비현실적인 상황도 자연스럽게 표현.

    프롬프트 예시:

    • "A cat wearing sunglasses skateboarding in a bustling urban environment."
    • "Fire burning on ice in a surreal but realistic manner."

  1. 스타일과 세부 묘사:

    • 레고 장난감으로 크리스마스 스토리 스톱 모션을 생성해 단편 애니메이션 제작 가능성을 시연.
    • 나초 광고에서 재질 및 움직임을 실사처럼 표현해 상업적 활용 가능성을 확인.

    프롬프트 예시:

    • "A stop-motion Christmas story featuring LEGO characters in a snowy village."
    • "A close-up of nachos with melted cheese dripping and steam rising in a cinematic style."

  1. 복합적 상황 묘사:

    • 파란 수영 고글을 쓴 펭귄이 다양한 색의 풍선을 매고 도시 광장을 활보하는 장면.
    • 분수에서 뛰어드는 펭귄의 역동적인 모습까지 구현.

    프롬프트 예시:

    • "A playful penguin wearing blue swimming goggles and carrying colorful balloons, jumping into a fountain in a lively city square."

    • 위에 예시로 제가 저렇게 쓰긴 했지만, 실제로 그륜님이 위 영상 제작에 사용한 프롬프트를 가져오면 다음과 같습니다:

      🎥 프롬프트:

      "35mm 렌즈로 촬영중간 높이의 전방 추적 샷.

      밝은 파란 수영 고글을 쓰고, 다양한 색의 풍선이 달린 작은 노란 배낭을 맨 장난기 가득한 펭귄이 활기찬 도시 광장을 자신감 있게 걸어가며 카메라를 향해 다가옵니다.

      펭귄의 발걸음에 따라 가방이 리듬감 있게 흔들리며, 분수의 물줄기를 피하다가 힘차게 뛰어올라 얕은 분수로 뛰어듭니다.

      물방울이 사방으로 튀며 생동감 넘치는 장면이 연출됩니다."

    • 이처럼 세부 디테일 강조, 동작 및 카메라 연출 등의 상세한 표사를 통해서 더욱 더 완벽한 영상을 생성해낼 수 있습니다.

  1. 자연 풍경 시뮬레이션:

    • 드론 시점에서 촬영한 등대와 파도의 움직임을 표현.
    • 파도의 거품이 바위에 부딪히는 디테일까지 사실적으로 구현.

    프롬프트 예시:

    • "Waves crashing against a lighthouse, seen from a drone's perspective with cinematic lighting."

Veo2의 장점과 한계

장점

  • Veo2는 Sora 대비 더 사실적이고 시네마틱한 비디오 생성이 가능합니다.
  • 광고, 영화, 뮤직비디오 등 상업적 목적에 적합한 고품질 영상 제작이 가능합니다.
  • 텍스트 프롬프트만으로 다양한 스타일과 상황을 구현할 수 있어 효율적입니다.
  • 유체 시뮬레이션, 조명 효과 등 디테일한 표현에 강점을 가지고 있습니다.

한계

  • 외부 이미지를 비디오로 변환하는 기능이 아직 제한적입니다.
  • 사람의 움직임이나 빠른 동작에서는 왜곡이나 일그러짐이 발생할 수 있습니다.
  • 생성된 캐릭터의 일관성이 부족해 단편 영화 제작 시 제약이 될 수 있습니다.
  • 긴 시간의 비디오 제작에서는 여전히 처리 시간이 오래 걸릴 수 있습니다.

Veo2 vs Sora

차이점

다음은 영상에서 언급된 Veo2Sora의 차이점입니다.

  1. 생성 비디오 길이
    • Veo2최대 2분 길이의 비디오를 생성할 수 있는 반면, Sora는 이보다 훨씬 짧은 길이의 비디오 생성에 한정됩니다.
    • 이를 통해 Veo2는 긴 스토리텔링이 필요한 상업적 비디오, 영화 장면, 혹은 뮤직비디오 제작에 적합한 모델로 평가됩니다.
  1. 물리적 현실감
    • Veo2는 물리적 현실감, 즉 물체의 움직임, 중력, 유체 동역학 등의 표현이 매우 정확하여 자연스러운 장면을 구현합니다.
      • 예: 고양이가 물 속에서 공을 가지고 노는 장면이나, 물방울이 튀는 디테일에서 Veo2의 강점이 돋보임.
    • 반면, Sora는 물리적 상호작용이 제한적이고, 종종 움직임이 부자연스럽거나 어색하게 표현되는 경우가 있음.
  1. 스타일과 창의성
    • Veo2는 포토리얼리즘, 애니메이션 스타일, 영화적 연출 등 다양한 스타일을 지원하며, 사용자가 원하는 텍스트 프롬프트에 높은 적응성을 보입니다.
      • 예: 텍스트 프롬프트를 기반으로 도심에서 스케이트를 타는 고양이의 자연스러운 움직임과 주변 환경을 완벽히 묘사.
    • Sora는 비슷한 스타일을 생성하지만, 결과물이 종종 예측 가능하며 창의성이 부족하다는 평가를 받음.
  1. 프롬프트 적응성(prompt adherence)
    • Veo2는 프롬프트에 적합한 세부 사항을 더 충실히 반영하여 사용자가 원하는 결과물을 정확히 생성함.
      • 예: "A penguin wearing blue swimming goggles and carrying colorful balloons walking through a city square."라는 프롬프트에 따라, 펭귄의 고글, 풍선의 색상, 도심 환경까지 충실히 구현.
  • Sora는 같은 프롬프트를 사용했을 때, 디테일이 부족하거나 프롬프트에서 벗어난 요소가 포함될 수 있음.
  1. 시뮬레이션 표현
    • Veo2는 특히 물 시뮬레이션과 같은 복잡한 물리적 상호작용에서 압도적인 결과를 보여줌.
      • 예: 오리 튜브 위에 앉은 수달이 물 속에서 움직이며 물방울이 자연스럽게 튀는 장면은 Veo2의 기술력을 증명.
    • Sora는 이와 같은 장면에서 물리적 디테일이 부족하고, 움직임이 끊기거나 비현실적인 표현이 나타남.

직접 비교

다음은 Veo2 공식 홈페이지에 나온 영상과 프롬프트를 Sora에 적용했을 때의 결과를 직접 한번 비교해보겠습니다.

1. 1980년대 주방의 귀여운 캐릭터

프롬프트:
"This medium shot, with a shallow depth of field, portrays a cute cartoon girl with wavy brown hair, sitting upright in a 1980s kitchen. Her hair is medium length and wavy. She has a small, slightly upturned nose, and small, rounded ears. She is very animated and excited as she talks to the camera."

평가:

  • Veo2 결과:
    Veo2는 캐릭터의 디테일과 애니메이션 품질이 뛰어났으며, 1980년대의 따뜻하고 복고풍의 주방 배경을 충실히 구현했습니다. 특히, 얕은 심도로 인해 캐릭터가 배경에서 부드럽게 분리되었으며, 표정과 동작에서 자연스러운 생동감을 표현했습니다.
  • Sora 결과:
    Sora는 캐릭터의 디테일과 애니메이션 품질이 비교적 단조롭고, 배경의 디테일에서 부족함이 드러났습니다. 특히 1980년대 주방의 정서를 전달하는데 실패했으며, 캐릭터의 움직임도 덜 생동감 있었습니다.

결론: Veo2의 우위. 캐릭터와 배경 모두 프롬프트의 요구사항에 훨씬 잘 부합했습니다.

2. 아침 식사와 팬케이크의 디테일

프롬프트:
"The sun rises slowly behind a perfectly plated breakfast scene. Thick, golden maple syrup pours in slow motion over a stack of fluffy pancakes, each one releasing a soft, warm steam cloud. A close-up of crispy bacon sizzles, sending tiny embers of golden grease into the air. Coffee pours in smooth, swirling motion into a crystal-clear cup, filling it with deep brown layers of crema. Scene ends with a camera swoop into a fresh-cut orange, revealing its bright, juicy segments in stunning macro detail."

평가:

  • Veo2 결과:
    Veo2는 팬케이크, 메이플 시럽, 베이컨 등 아침 식사 요소의 텍스처를 매우 사실적으로 표현했습니다. 특히, 슬로우 모션으로 시럽이 흐르는 장면과 증기가 나오는 디테일은 몰입감을 높였으며, 오렌지의 매크로 샷에서도 색감과 디테일이 매우 뛰어났습니다.

  • Sora 결과:
    Sora는 메이플 시럽과 팬케이크를 표현하는 데 있어 디테일이 부족했으며, 슬로우 모션 효과나 증기 표현에서 부드럽지 못했습니다. 오렌지 샷도 Veo2에 비해 덜 사실적이었고, 카메라 움직임도 덜 매끄러웠습니다.

결론: Veo2의 압승. Sora는 텍스처와 디테일에서 부족함을 드러냈습니다.

3. 양봉 장면과 자연 풍경

프롬프트:
"The camera floats gently through rows of pastel-painted wooden beehives, buzzing honeybees gliding in and out of frame. The motion settles on the refined farmer standing at the center, his pristine white beekeeping suit gleaming in the golden afternoon light. He lifts a jar of honey, tilting it slightly to catch the light. Behind him, tall sunflowers sway rhythmically in the breeze, their petals glowing in the warm sunlight. The camera tilts upward to reveal a retro farmhouse with mint-green shutters, its walls dappled with shadows from swaying trees."

평가:

  • Veo2 결과:
    Veo2는 햇빛 아래의 양봉가와 벌통의 디테일을 훌륭하게 표현했으며, 카메라 움직임이 부드럽고 일관적이었습니다. 특히, 꿀 병에 반사되는 빛과 해바라기의 움직임이 매우 자연스러웠습니다. 레트로 스타일의 농가도 프롬프트의 요구사항을 충실히 반영했습니다.

  • Sora 결과:
    Sora는 벌통과 농부의 디테일에서 부족함이 있었으며, 꿀 병의 반사 효과가 덜 자연스러웠습니다. 해바라기와 배경의 조화도 부족하여 전체적인 영상의 몰입도가 떨어졌습니다.

결론: Veo2의 우위. 자연 풍경과 햇빛 효과에서 높은 품질을 보여주었습니다.

💡 종합 평가
Veo2는 모든 프롬프트에서 프롬프트 적응성(prompt adherence), 디테일, 자연스러운 움직임에서 Sora를 압도했습니다. Sora는 단순한 비디오 생성에는 적합하지만, 높은 수준의 디테일과 사실적인 표현이 요구되는 장면에서는 Veo2에 비해 부족함이 두드러졌습니다.

  • Veo2 추천: 광고, 영화, 고품질 콘텐츠 제작에 적합.
  • Sora 활용 가능성: 간단한 스타일의 애니메이션 또는 짧은 비디오 제작에 적합.
    물론 Veo2에 최적화된 프롬프트를 사용했기에 그럴수도 있지만, 그럼에도 불구하고 사실성을 요구하는 영상에서의 성능은 떨어지는 것을 볼 수 있었습니다.

Veo2는 사실감과 창의적인 연출 모두를 제공하며, AI 비디오 생성의 새로운 기준을 제시합니다.


Veo2 사용 방법

Veo2는 현재 Google Labs Early Access 프로그램을 통해 신청 가능하며, VideoFX에서 활용할 수 있습니다. 미국 내 만 18세 이상 사용자에게 제한적으로 제공되고 있으며, 베타 프로그램을 통해 피드백을 수집 중입니다.

베타테스터로 선정되면 아래와 같은 기능들을 체험해보실 수 있습니다:

Veo2 베타 프로그램 정보

  • Veo2는 현재 Google Labs Early Access 프로그램을 통해 제공되며, VideoFX 플랫폼에서 기능을 체험할 수 있습니다.

  • 접근 방법:

    1. Google Labs 사이트에서 신청 후 초대 승인.
    2. VideoFX 툴에서 Text to Video 또는 Text to Image to Video 기능 사용 가능.
  • 베타 사용자 피드백:

    • Veo2는 사용자의 피드백을 수집하여 기능 개선과 오류 수정을 진행하고 있습니다.
    • 향후 정식 버전 출시를 목표로 합니다.

Text to Video 기능:
사용자가 입력한 텍스트 프롬프트를 기반으로 비디오를 생성합니다.

  • 프롬프트에 다양한 세부사항(예: 스타일, 카메라 각도, 조명 조건 등)을 포함하여 원하는 비디오의 시각적 특성을 지정할 수 있습니다.
  • 이 기능은 포토리얼리즘을 지원하며, 35mm 필름 같은 영화적인 스타일도 선택 가능합니다.
  • 또한, 다양한 버전의 비디오가 생성되어 비교 후 가장 적합한 결과물을 선택할 수 있습니다.
  • 예시: 프롬프트 입력
    • *"A playful otter sitting on a bright yellow rubber duck float, drifting along a serene river in a lush valley. The otter splashes playfully as the duck float bobs with the gentle current."
  • 결과:
    • 잔잔한 강물을 따라 떠다니는 오리 튜브 위의 장난스러운 수달의 움직임과 주변 자연환경의 사실적인 묘사가 포함된 비디오.

Text to Image to Video 기능:
텍스트를 이미지로 변환한 후, 해당 이미지를 기반으로 비디오를 생성하는 프로세스를 제공합니다.

  • 이를 통해 사용자는 특정 장면을 먼저 이미지로 구체화한 후, 이를 비디오로 확장할 수 있습니다.
  • 정적인 이미지에 자연스러운 움직임을 추가하여 더욱 사실적인 결과를 얻을 수 있으며, 독특한 스타일의 애니메이션 비디오 제작에 적합합니다.

  • 예시:
    • 텍스트 입력:
      "A penguin in a bustling city square, surrounded by pigeons and street performers. The penguin pauses at a fountain, shaking off water droplets before glancing directly at the camera."
    • 생성 과정:
      1. 펭귄과 도시 광장의 정적인 이미지를 생성.
      2. 이후 펭귄의 털이 물방울을 털어내는 움직임과 생동감 있는 주변 환경을 추가한 비디오로 확장.
  • 결과:
    • 펭귄의 세밀한 동작과 도시 광장의 활기찬 분위기가 잘 어우러진 비디오 장면.

위와 같이 Veo2는 창작자와 콘텐츠 제작자에게 새로운 가능성을 열어주는 도구로 자리 잡고 있습니다. 베타 테스트 이후 더 많은 기능과 안정성을 제공할 것으로 기대됩니다. (나도 문 열어줘!!!)

Veo2의 미래

Veo2는 기술적 한계를 극복하기 위한 지속적인 발전이 예상됩니다. 특히 상업적 용도로 활용하기 위해서는 사용자 맞춤형 옵션과 캐릭터 일관성 개선이 필요합니다. 베타 테스트 결과, 현재 AI 발전 속도를 고려할 때 이러한 문제점은 1~2년 내에 개선될 가능성이 높습니다.

추가적으로 Veo2는 AI 비디오 제작 기술을 넘어 다양한 창작 환경에 활용될 수 있습니다. 예를 들어, 게임 디자인, 가상현실 콘텐츠 제작, 교육용 영상 등 다양한 분야에서 잠재력을 가지고 있습니다. 이러한 발전은 창작자들이 더욱 창의적이고 혁신적인 작업을 할 수 있도록 지원할 것입니다.

Veo2는 AI 비디오 생성 기술의 새로운 장을 열었으며, 창작자들에게 혁신적인 도구로 자리 잡을 잠재력을 가지고 있습니다. 앞으로 Veo2의 진화와 활용 가능성은 영상 제작 업계에 큰 변화를 가져올 것으로 기대됩니다.

profile
Always be passionate ✨

1개의 댓글

comment-user-thumbnail
2025년 1월 2일

우와 정말 정리 잘하시네요!
포스팅 잘 보고 갑니다

답글 달기