챗GPT를 비롯하여 AI 시장이 발빠르게 성장하는 요즘, 구글에서 대규모 AI인 '제미나이'를 공개했다. 보통 다른 AI들은 구현에 집중하는 반면 제미나이는 추추론까지 가능하게 한다. 텍스트에만 얽매이지 않고 이미지, 음표같은 추성적인 형태도 정보를 인지하고 추론 및 해석한다.
구글에서 선보인 시연 영상이 이슈가 되었다. 제미나이가 멀티모달(Multi Modal) 기능으로 상호작용할 수 있다는 것을 예시적으로 보여주었다. 멀티모달은 시각, 청각 등을 활용해 텍스트 뿐만 아니라 이미지, 음성, 영상 등으로 상호작용하는 것인데, 영상에서 이미지를 인식하여 음성으로 말하거나 들을 수 있는 상호작용을 보여주었다.
하지만, 이 영상이 사실은 편집된 영상이었다는 것이 드러났고 구글 측에서도 “시연을 위해 응답 속도를 높였다. 영상을 편집했다”며 인정을 했다.
아직 실제로 서비스가 출시하기 전에는 어느정도의 정확성과 신뢰성을 가진 인공지능이 나올지 확신하기 어려울것 같다. 그 외에도 인공지능 시스템은 오류나 결함을 가질 수 있고 이러한 시스템을 사용할 때는 신뢰성과 안전성을 고려해야 하며, 기술적 문제에 대응할 수 있는 대비책을 잘 마련해야 한다고 생각한다.
AI가 단순한 해석을 너머 추론 능력을 가진다면 인간의 능력에 더욱 조바심이 들것 같다. 예술분야까지 많은 분야에 영향을 끼칠 AI 가 기대되면서도 걱정이 되는 부분이다. 사람이 가진 창의, 공감능력, 의사소통 능력 등 인공지능과 비교되는 인간만이 가질 수 있는 점이 있다고 생각한다. 이점들을 꾸준히 발전시켜나가고 인공지능에 의존하지 않도록 경각심을 갖는 자세도 중요한것 같다.