처음 OpenAI가 선보인 ChatGPT를 써보고, 정말 이게 된다고? 생각했던 때가 엊그제 같은데 벌써 VEO2가 나와버렸다.
https://deepmind.google/technologies/veo/veo-2/
[Veo2][출처: veo2.org]

혹시 눈치챈분이 계실까?
맞다. Veo 아니고, Voe.... DLFJS WJDAKF... DKDH!
조심하시기 바란다. 참 나쁜 사람들 열심히 산다. ...
공식 사이트: https://deepmind.google/technologies/veo/veo-2/
VEO 2 - Leading AI Video Generation Tool
Discover VEO 2, the advanced AI video generation tool offering exceptional video quality and user experience.
veo2.org
Veo2를 가장 잘 설명한 영상이다.
이분 미국에서 활동하시는 찐 전문가시다. 팔로우 필수!
https://www.youtube.com/watch?v=Eyj-i0euL9M&t=1058s
참 세상 좋아졌다. AI로 만들어진 내용을 AI가 리뷰, 수정해준다. 아래 내용은 퍼플렉시티의 리뷰 내용이다.
AI 영상 제작의 혁신을 경험할 수 있는 영상입니다. 이 영상에서 김그륜 디자이너는 bo2의 뛰어난 퍼포먼스를 검토하고 다양한 시뮬레이션 사례를 통해 현실적인 표현의 한계를 뛰어넘는 결과물을 보여줍니다. 다양한 상황을 시뮬레이션하여 실험하는 과정에서 나타나는 최고의 결과물들은 보는 이에게 큰 충격을 줍니다. 소라와 bo2 AI의 성능을 비교함으로써 각 기술의 강점과 한계를 명확히 드러내며, 창의성과 사실성을 동시에 갖춘 영상 제작의 미래에 대한 통찰도 제공합니다.[1]1. 🤖 BO2 AI 영상의 성능 평가와 다양한 시뮬레이션 실험
BO2 베타 테스트를 통해 제작한 AI 영상은 소라보다 뛰어나다는 평가를 받으며, 충격적인 성능을 보여준다.[1-1]
이 영상에서는 다양한 시뮬레이션 결과와 BO2의 퍼포먼스를 투명하게 확인할 수 있다.[1-3]
소라의 프롬프트와 비교하여 BO2로 제작된 결과물도 보여주고, 프롬프트 최적화 방법을 상세히 소개한다.[1-4]
BO2는 다양한 시뮬레이션 상황, 특히 동물들의 털, 물 시뮬레이션을 포함한 여러 재질의 특성을 탁월하게 이해한다.[1-12]
BO2의 영상은 CG 전문가조차 충격적이라고 표현할 정도로 완벽에 가까운 효과를 자랑한다.[1-15]
2. 🐾 BO2 시뮬레이션과 리얼함의 경이
고양이가 물속에서 고무공을 가지고 노는 시뮬레이션이 리얼함을 극대화하여 기포와 공의 부유 현상까지 자연스럽게 재현되었다.[2-1]
다양한 재질의 물체를 프레스기로 눌러보는 실험을 통해, 단단한 물체가 압력을 받으며 깨지거나 구부러지는 자연스러운 현상을 확인하였다.[2-2]
오리 인형과 슬라임 재질의 조합으로 프레스를 적용했을 때, 슬라임이 나오는 장면이 정말 리얼하게 연출되어 놀라움을 줬다.[2-6]
BO2는 상황에 따라 다양한 아이디어를 적용하여, 실제로는 불가능한 상황조차도 자연스럽게 만들 수 있어 창의적인 표현을 잘 보여준다.[2-10]
BO2는 시네마틱한 퀄리티를 제공하며, 상업적인 광고용으로도 사용 가능할 정도로 그 결과물이 상당히 뛰어나다.[2-22]
3. 🐱 BO2와 소라 영상 비교 결과
BO2에서 생성된 고양이 스케이트보드 장면은 사실적인 라이팅을 보여주며, 소라의 어색한 점프와 인터랙션 부족을 극복한다. [3-4]
소라의 등대 영상에서는 파도 시뮬레이션의 어색한 끊김 현상과 거품 표현의 불일치가 눈에 띄었다. [3-8]
BO2는 자연스럽게 표현된 파도와 거품을 시뮬레이션하여 물과 관련된 장면에서 더 뛰어난 결과를 보였다. [3-13]
소라의 길거리 버스킹 장면은 강한 콘트라스트의 라이팅으로 인해 부자연스러운 느낌을 주지만, BO2는 실제 촬영한 장면처럼 사실감이 있다. [3-19]
비호에서 만든 나초 장면은 광고처럼 보일 정도로 리얼함과 창의적 표현이 돋보이며, BO2가 시뮬레이션에서 압승을 거두는 모습이다. [3-26]
전반적으로, BO2은 소라보다 적은 오류와 더 나은 표현을 보인다. [3-29]
4. 🎥 AI 영상 제작 플랫폼 비교 분석
소라의 영상은 스튜디오에서 연출된 느낌이 나는 반면, 비호는 구글의 유튜브 데이터 덕분에 시네마틱한 멋을 더 잘 표현한다. [4-1]
비호는 리믹스 기능을 제공하여 사용자가 원본 영상의 화질을 개선하거나 새로운 영상을 만들 수 있는 기회를 제공한다. [4-4]
이미지 투 비디오와 텍스트 투 비디오 과정에서 오류가 빈번하게 발생하고, 원하는 방식으로 이미지를 움직이기 어렵다는 문제가 존재한다. [4-12]
비호의 베타 테스터들은 최대 720p로 영상을 제작할 수 있지만, 공식적으로는 4K 렌더링이 가능하다. [4-15]
비호에는 외부 이미지를 비디오로 변환하는 기능이 아직 부족하여 다양하고 복잡한 영상을 만들기가 어려운 상황이다. [4-11]
4.1. AI 영상 제작의 기능 비교
소라에서 제작된 영상은 자연의 움직임에서 끊김 현상이 나타나며, 스튜디오 연출 느낌이 강하다. [4-1]
소라의 영상 데이터는 주로 스톡 이미지 사이트에서 학습된 것으로 보인다.[4-2]
비호는 유튜브의 다양한 영화와 드라마 장면을 참고하여, 더 시네마틱한 영상 스타일을 구현할 수 있다.[4-3]
소라는 다양한 기능을 제공하여 비호와 차별화되며, 특히 리믹스 기능을 통해 영상의 변형 강도를 조절할 수 있다.[4-4]
블렌드 기능을 사용하면 두 영상을 자연스럽게 섞을 수 있어 트랜지션에서 유용하다.[4-7]
추가적으로, 루핑, 리커, 스토리보드 등의 기능을 통해 제작자는 더 많은 커스터마이징 옵션을 선택할 수 있다.[4-8]
4.2. 비호 영상 제작 기능 및 퍼포먼스
현재 비호에서는 외부에서 생성한 이미지를 바로 비디오로 변환하는 기능이 없으며, 텍스트를 이미지로 생성하는 기능만 지원된다.[4-9]
이미지에서 비디오로 변환할 때 더 많은 오류가 발생하는 경향이 있어, 사용자가 원하는 대로 이미지가 움직이지 않는 경우가 많다.[4-12]
베타 테스터들은 최대 720p 사이즈의 영상을 제작할 수 있지만, 공식 사이트에서는 4K 아지 렌더가 가능하다고 발표되었다.[4-15]
비호의 베타 테스터들은 텍스트 투 비디오와 텍스트에서 이미지를 생성하고 이를 비디오로 변환하는 두 가지 옵션을 제공받으며, 개인적인 경험에 따르면 텍스트 투 비디오의 퍼포먼스가 더 좋았다.[4-19]
BO2의 프롬프트 디벨로 과정은 다른 AI 영상 제작 툴에서도 활용이 가능하며, BO 공식 소개 사이트에서 잘 만든 영상과 프롬프트를 확인할 수 있다.[4-25]
4.3. AI 영상 제작 과정 및 성과
BO2의 베타 테스트 과정을 통해 사용자는 프롬프트를 복사하고 이를 사이트에 붙여 넣어 '크리에이트 비디오' 버튼을 클릭함으로써 영상을 생성할 수 있다.[4-46]
한 번에 여덟 가지의 영상을 제작할 수 있으며, 사용자는 다른 프롬프트를 반복하여 적용할 수 있다.[4-48]
영상 제작에 걸리는 시간은 3분에서 5분이며, 각 프롬프트당 네 가지의 다양한 버전이 생성된다.[4-51]
생성된 영상은 라이브러리에 보관되지 않으며, 웹 페이지가 닫히면 사라지기 때문에 사용자는 모든 영상을 다운로드해야 한다.[4-59]
다양한 동물과 환경이 등장하며, 특히 사실적인 표현이 뛰어나고 사용자는 이 결과에 매우 만족하고 있다.[4-64]
4.4. ️ BO2의 한계와 발전 가능성
BO2의 가장 큰 한계는 외부에서 만든 이미지를 비디오로 변환하는 기능이 없어 다양한 스타일의 영상을 만들기 어렵다는 점이다. [4-76]
만약 이러한 기능이 추가된다면, 무궁무진한 상상력이 더해진 영상들을 제작할 수 있을 것으로 예상된다. [4-77]
상업적인 목적이나 실무에서 활용하기 위해서는 커스터마이징이 필요하며, 사용자가 원하는 대로 영상을 제작할 수 있는 옵션이 중요하다. [4-78]
현재는 상당히 리얼한 영상을 제작하지만, 사용자가 원하는 대로 요청할 수 없는 치명적인 단점이 존재한다. [4-80]
특히 사람의 움직임에서는 상당한 오류가 있어 AI 특유의 일그러지는 현상이 나타나는 문제가 있다. [4-81]
단편 영화, 뮤직비디오, 광고 같은 용도로 사용하기 위해서는 캐릭터의 일관성이 중요하지만, 현재 영상 생성 시 변형이 가해져 일관된 캐릭터 만들기가 어렵다. [4-83]
이 문제를 해결하고 캐릭터의 일관성이 있게 만들어질 수 있다면, 상업적인 용도로도 활용 가능할 것으로 추정된다. [4-85]
4.5. AI 영상 툴의 퀄리티 평가
사용해 본 영상 AI 중에서 독보적으로 좋은 퀄리티를 보였다. [4-86]
현재 AI 기술의 발전 속도를 고려할 때, 움직임의 오류와 어색한 부분들은 빠른 시간 내에 개선될 것으로 추정된다. [4-87]
다양한 AI 영상 툴들은 각각의 장점이 뚜렷하다. [4-88]
현재 원하는 영상을 제작하기 위해서는 다양한 AI 영상 툴을 함께 사용하는 것이 필요하다. [4-89]
이번 실험의 주요 결론은 독보적으로 퀄리티가 높다는 것이다. [4-90]
5. 🚀 AI 영상 제작의 미래 전망
현재 AI 영상 제작의 어색한 부분들은 1년 이내에 개선될 것으로 예상되며, 2년 안에는 업계의 큰 변화가 있을 것으로 보인다. [5-1]
5년 이상을 내다보면 기존의 파이프라인이 차원이 다르게 바뀔 가능성이 높다. [5-2]
AI 유튜브를 시작한 이유는 변화 속에서 미리 준비하고 발전한 사람들에게 새로운 기회가 올 것이라고 믿기 때문이다. [5-4]
해외의 영상 제작은 매우 발빠르게 진화하고 있으며, 한국도 이러한 정보를 통해 도움이 되기를 바란다. [5-5]
채널을 통해 좋은 정보를 공유하고, 함께 발전하며 변화 속에서 더 깊은 가치를 만들어갈 수 있을 것이라고 믿는다. [5-6]
이 블로그 포스트에서 몇 가지 중요한 수정이 필요한 부분을 지적하겠습니다:
사실 관계 오류
• “BO2”라는 표현은 모두 “Veo 2”로 수정되어야 합니다. Veo 2가 Google DeepMind의 공식 명칭입니다.
• 720p 해상도 관련 설명은 정확하나, 4K 해상도는 아직 일반 사용자에게 제공되지 않는 기능입니다.
기술적 설명 오류
비디오 생성 기능
• 외부 이미지 변환 기능 부재에 대한 설명은 부정확합니다. Veo 2는 다양한 입력 방식을 지원하며, 시네마틱 효과와 카메라 컨트롤 기능을 제공합니다.
성능 비교
• Sora와의 비교 부분에서 일부 부정확한 내용이 있습니다. Veo 2는 4K 해상도를 지원하는 반면 Sora는 1080p로 제한됩니다.
구조적 개선사항
• 섹션 4의 하위 섹션들(4.1-4.5)은 너무 세분화되어 있어 통합이 필요합니다.
• 중복되는 내용(특히 해상도와 기능 설명 부분)을 제거해야 합니다.
• 기술적 특징과 한계점을 더 명확하게 구분하여 설명할 필요가 있습니다.
추가 권장사항
• Google DeepMind의 공식 자료를 인용하여 신뢰성을 높일 필요가 있습니다.
• 실제 사용 사례와 벤치마크 결과를 더 구체적으로 포함하면 좋을 것 같습니다.
• 가짜 사이트 주의에 대한 경고는 매우 적절하며 강조되어야 합니다.