포스팅 고민...개인적인 it생각

궁금하면 500원·2026년 5월 2일

IT이야기

목록 보기
15/15

ai관련된 모든게시물이.. 특히 오래된 게시물 조회수가 1300여개의 조회수를 능가한것이 보였다.

요즘 들어 문득 그런 생각이 든다.
클라우드 인프라 종속성보다 더 무서운 것은 어쩌면 LLM 프롬프트와 토큰 종속성일지도 모른다고.

예전에는 특정 클라우드 벤더에 종속되는 것이 가장 큰 리스크처럼 느껴졌다. AWS, Azure, GCP 중 어디에 깊게 묶이느냐에 따라 아키텍처의 자유도가 달라졌고, 비용 구조도 크게 흔들렸다. 그런데 지금은 그보다 더 근본적인 층에서 종속이 일어나고 있다. 코드를 실행하는 인프라가 아니라, 생각을 대신해주는 모델 자체에 종속되는 시대가 오고 있다.

만약 어느 날 빅테크들이 토큰 비용을 급격히 올려버린다면 어떻게 될까.
단순히 API 비용이 조금 부담되는 수준에서 끝나지 않을 것이다.
이미 제품 기획, 코드 작성, 테스트, 문서화, 운영 자동화까지 LLM에 깊게 연결된 조직들은 순식간에 비용 구조가 무너질 수 있다.
더 무서운 건, 그렇게 되면 개발이라는 행위 자체가 막대한 유지비를 감당할 수 있는 기업이나 자본가 중심으로 재편될 수 있다는 점이다.

옛날 사람들이 불을 피우는 법, 야생에서 살아남는 법을 잊어버린 것처럼, 우리도 어느 순간부터 코어 로직을 바닥부터 짜는 능력을 잃어버릴지도 모른다.
문제를 분해하고, 자료구조를 고르고, 트랜잭션 경계를 잡고, 장애 상황을 상상하며 설계하는 능력보다 “어떤 프롬프트를 던지면 더 그럴듯한 코드가 나오는가”에만 익숙해질 수도 있다.

물론 도구를 쓰는 것 자체가 문제는 아니다.
인간은 늘 도구를 통해 생산성을 높여왔다. 컴파일러, 프레임워크, 클라우드, 컨테이너, CI/CD 모두 처음에는 추상화였고, 결국 개발자의 생산성을 폭발적으로 끌어올렸다.
하지만 지금의 LLM은 조금 다르다. 단순히 반복 작업을 줄여주는 도구가 아니라, 판단과 설계의 일부까지 가져가려는 도구다. 그래서 더 조심해야 한다.

어쩌면 프론티어 기업들이 그리는 큰 그림은 여기 있을지도 모른다.
진짜 엔지니어링 역량을 가진 사람들을 완전히 대체한다기보다, 시장 전체가 자신들의 모델 없이는 제대로 움직일 수 없도록 만드는 구조. 개발자는 많아지지만, 모델 없이 스스로 설계하고 구현할 수 있는 사람은 줄어드는 구조. 겉으로는 민주화처럼 보이지만, 안쪽으로 들어가면 거대한 독점 구조가 만들어지는 그림이다.

이런 생각을 안고 오늘 오모콘에 다녀왔다.
형님 얼굴도 뵙고 발표도 들었는데, 현장의 열기는 생각보다 훨씬 뜨거웠다.
단순히 “AI로 개발하면 편하다” 정도의 분위기가 아니었다. 이미 흐름은 그 다음 단계로 넘어가고 있었다.

가장 크게 느낀 건 트렌드의 이동이다.
이제는 개발자가 AI와 직접 대화하면서 코드를 짜는 수준, 이른바 바이브 코딩만으로는 부족해지고 있다.
몇 달 전만 해도 코딩은 꽤 혁신적으로 보였다.
요구사항을 던지고, AI가 코드를 만들고, 사람이 다시 수정하고, 또 AI에게 넘기는 방식. 분명 생산성은 올라간다.
하지만 오늘 발표를 들으면서 그 방식도 오래가지는 않겠다는 생각이 들었다.

결국 대규모 코드베이스에서는 사람이 AI와 일일이 핑퐁하는 방식 자체가 병목이 된다.
처음에는 2배, 5배, 10배까지는 생산성이 올라갈 수 있다. 그런데 그 이상으로 가려면 사람이 직접 모든 대화를 컨트롤하는 구조로는 한계가 온다.
요구사항 분석, 코드 변경, 테스트 작성, 리팩토링, 배포 검증, 문서화까지 각각의 에이전트가 나뉘어 움직이고, 사람은 그 흐름을 설계하고 검수하는 쪽으로 가야 한다.

행사를 이끄시는 분의 통찰도 정확히 그 지점을 짚고 있었다.
인간이 직접 컨트롤하는 바이브 코딩은 생산성 10배 언저리에서 한계에 부딪힌다는 말이 특히 기억에 남았다.
결국 앞으로의 개발자는 코드를 한 줄 한 줄 치는 사람이 아니라, 에이전트들이 일할 수 있는 환경을 설계하고, 방향을 잡고, 결과물을 검증하는 사람이 되어야 한다.

이 말이 꽤 무겁게 다가왔다.
왜냐하면 이건 단순히 “새로운 도구를 배워야 한다”는 수준의 이야기가 아니기 때문이다.
개발자의 역할 정의 자체가 바뀌고 있다.
예전에는 좋은 개발자란 코드를 잘 짜는 사람이었다.
그다음에는 설계를 잘 잡고, 협업과 운영까지 고려하는 사람이 좋은 개발자였다.
그런데 앞으로는 여기에 하나가 더 붙는다.

AI 에이전트에게 일을 제대로 나눠주고, 그 결과물을 냉정하게 판단할 수 있는 사람.

이게 앞으로의 개발자에게 요구되는 역량이 될 가능성이 높다.

AI가 코드를 더 많이 만들어낼수록, 그 코드가 맞는지 틀린지 판단하는 사람의 기본기는 더 중요해진다.
트랜잭션 경계가 이상한지, 동시성 문제가 생길 여지가 있는지, 인덱스 설계가 잘못됐는지, 보안적으로 위험한 코드인지, 장애 상황에서 복구 가능한 구조인지.
이런 건 결국 사람이 봐야 한다. AI가 그럴듯하게 말해도, 마지막 책임은 개발자에게 온다. 냉정하게 말하면, 사고 나면 프롬프트가 책임지는 게 아니라 사람이 책임진다.
참 현실적이고 서늘하다.

한편으로 행사장 공간은 철저히 20대의 유연한 육체를 기준으로 설계된 듯했다.
기술 변화도 빡센데 몸까지 고생하니, 이 세계에서 오래 살아남으려면 진짜 체력도 기술 스택이라는 생각이 들었다.
예전에는 농담처럼 “개발자는 허리가 생명”이라고 했는데, 이제는 거의 개발자 원칙처럼 느껴진다.
허리 무너지면 시스템도 같이 무너진다. 이건 농담 같지만 진짜다.

집에 돌아와서는 다시 소버린 AI에 대해 생각했다.
결국 핵심은 이것이다.
빅테크의 모델을 쓰지 말자는 단순한 공감이 아니다.
문제는 선택권이다.
필요할 때는 상용 API를 쓰되, 비용과 정책, 검열, 장애, 가격 인상에 휘둘리지 않을 최소한의 대안이 있어야 한다.
그 대안이 로컬 모델이고, 오픈 모델이고, 조직 내부에서 통제 가능한 AI 인프라다.

최근에는 API 종속성을 줄이기 위해 로컬 모델을 다시 만지고 있다.
예전 같으면 VRAM에 맞춰 적당히 Q4_K_M이나 XL 계열을 올리고 “돌아가면 됐다”고 생각했을지도 모른다.
하지만 요즘은 생각이 달라졌다.
단순히 모델이 돌아가는 것과, 쓸 만한 추론 품질을 내는 것은 완전히 다른 문제다.

특히 양자화 모델을 다루다 보면 체감이 크다.
무조건 큰 파라미터 모델을 억지로 올리는 것보다, 실제 손실이 낮고 정밀도가 유지되는 구간을 고르는 게 훨씬 중요하다. 모델 사이즈만 보고 “35B니까 좋겠지”라고 판단하면 안 된다. 어떤 양자화 포맷을 쓰는지, 손실이 어느 정도인지, 실제 코딩 작업이나 에이전트 작업에서 추론 일관성이 유지되는지가 더 중요하다.

예를 들어 Qwen 계열 35B 모델을 3090에서 돌릴 때도 그렇다.

VRAM을 조금 더 먹고 출력 속도가 20~25% 정도 떨어지더라도, 품질이 안정적인 양자화 구간을 선택하는 편이 낫다.
특히 코딩이나 에이전트 작업에서는 답변 속도보다 추론의 일관성이 더 중요하다.
빠르게 헛소리를 뱉는 모델보다, 조금 느리더라도 구조를 이해하고 일관된 판단을 해주는 모델이 훨씬 낫다.
빠른 삽질은 그냥 삽질의 고속도로다.


낮은 정밀도의 양자화 모델은 처음에는 그럴듯하게 답하지만, 코드베이스가 조금만 커지거나 요구사항이 복잡해지면 금방 맥락을 놓친다.
반면 손실이 낮은 모델은 느리더라도 설계 의도나 이전 맥락을 훨씬 안정적으로 붙잡고 간다.
이 차이는 벤치마크 숫자만 봐서는 잘 안 보인다.
직접 돌려보면 바로 느껴진다.

결국 요즘 내가 느끼는 결론은 단순하다.
앞으로의 개발자는 두 가지를 동시에 가져가야 한다.

하나는 상용 LLM과 에이전트를 적극적으로 활용하는 능력이다.
이 흐름을 외면하면 생산성 경쟁에서 밀릴 가능성이 높다. “나는 손코딩만 할 거야”라는 태도는 낭만은 있을지 몰라도 현실적인 생존 전략으로는 약하다.

다른 하나는 그 도구 없이도 버틸 수 있는 기본기와 로컬 생존력이다.
자료구조, 알고리즘, 네트워크, 운영체제, 데이터베이스, 아키텍처, 보안, 장애 대응. 이런 전통적인 기본기는 오히려 더 중요해질 것이다.
AI가 코드를 많이 만들수록, 그것을 검증할 수 있는 사람의 가치는 더 올라간다.
옛날 방식이 낡은 게 아니라, 밑바닥을 이해하는 사람이 더 귀해지는 시대가 오는 것이다.

오늘 하루를 정리해보면 묘한 기분이다.
한쪽에서는 에이전트들이 개발 방식을 완전히 바꾸고 있고, 다른 한쪽에서는 토큰 비용과 모델 종속성이 새로운 리스크로 다가오고 있다.
클라우드 시대에는 서버를 빌려 썼고, 이제는 사고 과정 일부를 빌려 쓰는 시대가 됐다.
편리하지만, 동시에 위험하다.

그래서 나는 당분간 두 방향을 같이 가져가려 한다.
상용 AI와 에이전트 흐름은 따라간다.
외면하지 않는다. 다만 거기에 완전히 기대지는 않는다.
로컬 모델도 계속 만지고, 작은 환경에서도 돌아가는 구조를 실험하고,
내가 직접 판단할 수 있는 엔지니어링 기본기도 놓지 않는다.

언젠가 토큰 가격이 오르거나, API 정책이 바뀌거나, 특정 모델 접근이 막히는 날이 올 수도 있다.
그때 완전히 멈춰버리는 개발자가 되고 싶지는 않다.
적어도 작은 불씨 정도는 내 손으로 피울 수 있어야 한다.

오늘도 뜬금없이 중국어를 토해내는 모델을 달래가며 다시 로컬 모델을 만진다.
거대 기업의 토큰 독점에 맞설 거창한 혁명까지는 아니어도, 최소한 내 손에 남겨둘 작은 생존 기술 하나쯤은 있어야 하지 않겠나.

개발자는 결국 도구를 쓰는 사람이다.
하지만 도구에 먹히는 순간, 더 이상 엔지니어가 아니다.
그 경계선을 잊지 않는 것.

profile
그냥 코딩할래요 재미있어요

0개의 댓글