마이크로서비스의 한계와 Service Mesh의 필요성(2. Istio란 무엇인가(3. Istio 아키텍처 깊이 이해하기(4. 실습: Istio 환경 구축(5. Gateway와 VirtualService 완벽 이해(6. 트래픽 흐름 완전 분석(7. Istio의 강력한
2025년 11월 8일수동 배포는 이제 그만! Git Push 한 번으로 자동 배포되는 마법Day 7에서 Ceph 분산 스토리지로 진정한 동적 프로비저닝을 경험했습니다. 이제 Day 8에서는 GitOps 패러다임의 핵심 도구인 Helm과 ArgoCD를 마스터하여 선언적
2025년 11월 7일단일 노드 한계를 넘어! RBD/CephFS/RGW 세 가지 스토리지를 모두 구축하다Day 6에서 Prometheus + Grafana로 모니터링, Vector + OpenSearch로 로그 중앙화를 마스터했습니다. 이제 Day 7에서는 Kuber

2025년 11월 4일Prometheus + Grafana로 메트릭 수집, Vector + OpenSearch로 로그 중앙화, Custom Metrics까지!Day 5에서 Production 환경 운영을 위한 Job/CronJob, Network Policy, Helm
2025년 11월 3일Job/CronJob, Network Policy, Resource Quotas, CRD, Helm Chart, etcd Backup, Cluster Upgrade까지!Day 4에서 Ingress, HPA, RBAC, StatefulSet, Dae
2025년 11월 3일Ingress, HPA, RBAC, StatefulSet, DaemonSet, Monitoring까지 완벽 정복!Day 3에서 Secret, Rolling Update, PV/PVC, Resource Limits, Health Check 등 운영에
3-node 클러스터에서 직접 실습하며 배운 Kubernetes Operations의 모든 것Day 2에서 클러스터 아키텍처와 네트워킹을 이해했다면, Day 3는 실전 운영에 필요한 기술들을 익히는 날이었습니다. Secret 관리부터 Rolling Update, Hea
3노드 클러스터 환경에서 Control Plane부터 실제 애플리케이션 배포까지Day 1에서 클러스터의 기본 구조를 이해했다면, Day 2는 실전이었습니다. Control Plane이 어떻게 동작하는지, Pod 간 통신이 실제로 어떻게 이루어지는지, 그리고 마침내 외부
안녕하세요! 저는 최근 온프레미스 환경에서 Kubernetes 클러스터를 직접 구축하고 운영하면서 많은 것을 배우고 있습니다. 오늘은 그 여정의 첫 번째 날, "클러스터 기초와 아키텍처 이해"에 대해 이야기해보려 합니다.처음 Kubernetes를 접할 때 가장 막막했던
Ubuntu에서 네트워크 설정을 변경하다가 예상치 못한 문제를 겪어본 경험이 있으신가요? 저는 최근 Ubuntu Desktop에서 Kubernetes 클러스터를 구성하면서 DNS 설정이 적용되지 않는 문제로 몇 시간을 씨름했습니다. 이 과정에서 Ubuntu의 네트워크
🤔 "클러스터 내부는 CNI가 알아서 하는데, BGP는 왜 필요하죠?" Kubernetes CNI와 BGP의 경계를 명확히 이해하고, 실전에서 BGP가 필요한 순간을 알아봅시다.BGP란 무엇인가?(2. CNI vs BGP: 역할 구분(3. BGP가 필요한 순간(4.
Calico와 Flannel, 어떤 CNI를 선택해야 할까? eBPF와 BGP가 뭐길래 성능이 3배나 빨라진다는 걸까? 실전 사용 사례를 통해 완벽하게 이해해보자.CNI란 무엇인가?(2. Calico vs Flannel 핵심 비교(3. eBPF 완전 정복(4. BGP

AWS에서 로드밸런서를 선택할 때 ALB(Application Load Balancer)와 NLB(Network Load Balancer) 중 어떤 것을 선택해야 할까요? 단순히 L7과 L4의 차이로만 이해하고 있다면, 실제 운영에서 예상치 못한 문제를 만날 수 있습니

단일 Terraform 모듈과 Terragrunt를 활용하여 Stage/Production 환경을 동일한 코드로 관리하며, GitHub Actions 기반 GitOps 파이프라인으로 인프라 배포 시간을 80% 단축하고 환경 간 불일치로 인한 장애를 Zero로 만든 프로

기존 Docker Registry에서 엔터프라이즈급 Harbor 플랫폼으로 전환하며, Harbor의 내장 Registry 기능을 활용한 자동 마이그레이션과 재해복구 체계를 구축한 프로젝트입니다. 7개 팀, 30명의 사용자가 사용하는 AI/ML 플랫폼의 컨테이너 레지스트

오프라인 환경에서 운영되는 엔터프라이즈급 AI/ML 추론 플랫폼을 구축한 프로젝트입니다. GPU 가속 추론, 3중화 클러스터링, 분산 스토리지, 그리고 완전한 오프라인 운영을 지원하는 마이크로서비스 아키텍처를 설계하고 구현했습니다.100% 오프라인 운영 가능한 AI/M
현대 클라우드 환경에서 인프라를 코드로 관리하는 것은 필수가 되었습니다. Terraform은 이러한 흐름을 선도하는 도구이지만, 복잡한 멀티 환경 구성에서는 여러 한계에 부딪히게 됩니다. 이 글에서는 Terraform에서 발생하는 코드 중복 문제를 해결하기 위해 Ter

안녕하세요! 오늘은 최근에 완성한 마이크로서비스 기반 로그 및 트레이스 분석 시스템의 개발 과정과 아키텍처에 대해 공유하려고 합니다. 특히 Model Context Protocol(MCP)을 활용한 접근 방식이 어떻게 효율적인 모니터링 솔루션으로 이어졌는지 설명드리겠습

현대 애플리케이션 환경에서 로그 모니터링은 시스템 안정성과 문제 해결에 필수적인 요소입니다. 특히 마이크로서비스 아키텍처와 분산 시스템이 보편화되면서, 여러 서비스에서 생성되는 로그를 효율적으로 수집하고 분석하는 능력은 DevOps 팀에게 중요한 역량이 되었습니다. 이

프로젝트 배경 우리 회사는 최근 운영 중인 4대의 물리 서버를 전력 소비 문제로 인해 본사에서 다른 사무실로 이전해야 했습니다. 이러한 물리적 이전에도 불구하고 IT 관리자로서 이 서버들을 효율적으로 원격 관리할 수 있는 방법이 필요했습니다. 이 블로그에서는 제한된