생성형 AI라고 한다면, 많은 것들이 있다. 이미지 또는 텍스트 생성과 같은 인공지능들이 많이 출시되었다. 그중에 가장 대표적인 것이 미드저니와 ChatGPT라고 생각한다.
생성형 AI가 우리 사회에 미칠 수 있는 영향은 한 개인의 생산성이 매우 높아질 수 있다는 것이다. 왜냐하면 ChatGPT에게 부탁하면, 보고서, 시, 시나리오와 같이 고차원 지능이 필요로 하는 일은 순식간에 해낼 수 있기 때문이다. 일례로 인공지능을 이용하여 캐릭터와 이야기를 만들고 이를 다시 이용하여 이미지를 만들어서 동화책을 출시하는 경우도 있다. 초등학생 정도 되는 아이가 말이다.
인공지능이 활용되는 분야 중에 하나가 또 로보틱스가 있다. 사실 내가 이제부터 인턴을 가게 되는 Bear Robotics란 곳도 로보틱스와 인공지능을 모두 사용하는 대표적인 기업이라고 할 수 있다.
난 이 부분에서 데이터 엔지니어로서 맡을 수 있는 업무와 그 업무의 생명령을 가늠했다. 사실 이전에 갔다온 "포럼 10년 후"에서는 IoT를 통해 특정 데이터를 추출해내는 작업과 이를 바탕으로 인공지능을 모델링 하는 작업만이 살아남을 것이란 내용을 들었다. 즉, 데이터를 수집하고 처리하는 과정은 인공지능이 모두 대체해버릴 것이란 뜻이었다.
만약 위와 같은 구조로 인공지능을 학습해야 한다면, 범용적인 IoT가 나오거나 기존의 IoT를 이용해서 새로운 데이터를 가져올 수 있도록 데이터 파이프라인을 구축하거나 둘 중 하나의 작업을 해야만 한다고 생각한다.
현재 인공지능 패권에 대해 다큐를 보고 정리한 내용은 아래와 같다.
반도체 ---------> 인공지능 ---> 경쟁력 우위 확보
클라우드 -> 데이터 -↑
즉 이제는 국가 간 패권을 얻기 위해선 초거대 AI를 소유해야만 한다. 초거대 AI가 마치 핵 폭탄과 같은 위상을 가질 수 있다는 뜻이다.
난 이 부분에서 또한 데이터 엔지니어의 수요를 가늠했다. 왜냐하면 인공지능 패권을 얻기 위해선 데이터 패권을 가져야만 하기 때문이다. 그러려면 데이터를 모아둘 수 있는 클라우드 컴퓨팅 환경이 제공되어야 한다. 즉, 데이터 패권이 클라우드 컴퓨팅 기술에 의존적이란 뜻이다. 그렇다면 데이터 엔지니어링의 업무 또한 클라우드 컴퓨팅에 의존적으로 변하리라 생각했다. 그렇다면 요즘 추세로 가늠해보자면 아마도 SaaS 기술들을 적절히 이용해서 데이터 파이프라인을 구축하는 식으로 변하지 않을까 생각했다. 만약 이 생각이 맞다면, 인공지능이 데이터 파이프라인을 구축해낸다면 아마도 클라우드 컴퓨팅에서 제공되는 SaaS 기술들을 조합하여 일을 처리하는 업무는 모두 대체되지 않을까 생각해본다. 또한 데이터 엔지니어링에 대한 업무가 코딩보단 데브옵스나 SRE처럼 단순히 대시보드를 통해서 일을 처리하는 식으로 업무의 모습이 변할 수도 있겠단 생각이 들었다.
한국은 전세계 인공지능 순위가 4위이다. 그러나 1등, 2등 그룹과 3등, 4등 그룹 간 격차가 크기 때문에 4등이라고 해서 좋아할 수 없는 입장이다. 그렇기 때문에 격차를 줄이기 위한 노력을 해야 하는데, 다큐에서는 현재 대한민국이 1등인 산업과 인공지능을 결부시켜야만 격차를 해소할 수 있다고 하였다. 그런데 우리나라는 반도체가 대표적인 1등 기술이 아닌가? 그래서인지 다큐에서도 NPU라는 차세대 인공지능 반도체에 대해서 언급한다. 즉 경쟁 패러다임에서 가장 밑에 있는 반도체를 공략하겠다는 뜻이다.
난 예전에 글쓰기 수업 때 철학적인 관점에서 인공지능에 대해서 서술한 적이 있다. 만약 정말 사람 같은 인공지능이 만들어졌을 때 인공지능을 죽인다면, 이는 처벌 대상이 되는지 여부에 대한 글이었다. 그 글의 결론은 인공지능은 인공지능으로 남아있어야 한다는 것이었다. 그리고 그 생각은 지금까지 변함이 없다.
만약 인공지능이 인간을 위한 도구의 영역을 벗어난다면 어떤 일이 발생하겠는가? 난 예측 불가능하다고 본다. 그래서 최악의 경우에는 인류를 공격할 수도 있다. 그래서인지 다큐에서 오픈 AI CEO가 나라를 돌아다니며 규제를 만들어 줄 것을 요청하는 모습이 담겨 있었다. CEO도 규제가 없다면 결국은 자기에게 손해란 계산을 한 것이다.
사실 이 다큐를 본 이유는 인공지능이 가져올 특이점에 대해서 고민해보고 싶었기 때문이다. 그리고 그 특이점은 현재 생성형 AI와 로보틱스 분야에서 활발하게 일어나는 듯 하다. 그러나 내가 살펴보고 싶었던 특이점 중에 하나였던 데이터 엔지니어링 수요는 직접적으로 확인할 수 없었다. 이를 위해선 내가 생성형 AI와 로보틱스, 데이터 엔지니어를 모두 공부해야만 알 수 있겠단 생각이 들었다. 조만간 토이 프로젝트로 데이터 파이프라인을 만들어보고 싶다.
잘 봤습니다. 좋은 글 감사합니다.