AWS에서 로드밸런서를 선택할 때 ALB(Application Load Balancer)와 NLB(Network Load Balancer) 중 어떤 것을 선택해야 할까요? 단순히 L7과 L4의 차이로만 이해하고 있다면, 실제 운영에서 예상치 못한 문제를 만날 수 있습니
단일 Terraform 모듈과 Terragrunt를 활용하여 Stage/Production 환경을 동일한 코드로 관리하며, GitHub Actions 기반 GitOps 파이프라인으로 인프라 배포 시간을 80% 단축하고 환경 간 불일치로 인한 장애를 Zero로 만든 프로
기존 Docker Registry에서 엔터프라이즈급 Harbor 플랫폼으로 전환하며, Harbor의 내장 Registry 기능을 활용한 자동 마이그레이션과 재해복구 체계를 구축한 프로젝트입니다. 7개 팀, 30명의 사용자가 사용하는 AI/ML 플랫폼의 컨테이너 레지스트
오프라인 환경에서 운영되는 엔터프라이즈급 AI/ML 추론 플랫폼을 구축한 프로젝트입니다. GPU 가속 추론, 3중화 클러스터링, 분산 스토리지, 그리고 완전한 오프라인 운영을 지원하는 마이크로서비스 아키텍처를 설계하고 구현했습니다.100% 오프라인 운영 가능한 AI/M
현대 클라우드 환경에서 인프라를 코드로 관리하는 것은 필수가 되었습니다. Terraform은 이러한 흐름을 선도하는 도구이지만, 복잡한 멀티 환경 구성에서는 여러 한계에 부딪히게 됩니다. 이 글에서는 Terraform에서 발생하는 코드 중복 문제를 해결하기 위해 Ter
안녕하세요! 오늘은 최근에 완성한 마이크로서비스 기반 로그 및 트레이스 분석 시스템의 개발 과정과 아키텍처에 대해 공유하려고 합니다. 특히 Model Context Protocol(MCP)을 활용한 접근 방식이 어떻게 효율적인 모니터링 솔루션으로 이어졌는지 설명드리겠습
2024년 말, Anthropic이 발표한 Model Context Protocol (MCP)는 LLM(대형 언어 모델)과 외부 서비스(데이터베이스, 파일 시스템, API 등)를 표준 방식으로 연결하기 위한 오픈 프로토콜입니다. 기존에는 모델과 시스템을 1:1 또는 N
현대 애플리케이션 환경에서 로그 모니터링은 시스템 안정성과 문제 해결에 필수적인 요소입니다. 특히 마이크로서비스 아키텍처와 분산 시스템이 보편화되면서, 여러 서비스에서 생성되는 로그를 효율적으로 수집하고 분석하는 능력은 DevOps 팀에게 중요한 역량이 되었습니다. 이
프로젝트 배경 우리 회사는 최근 운영 중인 4대의 물리 서버를 전력 소비 문제로 인해 본사에서 다른 사무실로 이전해야 했습니다. 이러한 물리적 이전에도 불구하고 IT 관리자로서 이 서버들을 효율적으로 원격 관리할 수 있는 방법이 필요했습니다. 이 블로그에서는 제한된
기업 환경에서 EC2 인스턴스의 효율적인 관리는 운영 안정성과 보안을 모두 고려해야 하는 중요한 과제입니다. 특히 프라이빗 서브넷에 위치한 EC2 인스턴스들은 직접적인 인터넷 접근이 제한되어 있어 관리가 복잡할 수 있습니다. 이 블로그에서는 Private API Gat
현대 소프트웨어 개발에서 CI/CD(지속적 통합/지속적 배포) 파이프라인은 개발 주기를 가속화하고 안정적인 배포를 보장하는 핵심 요소입니다. 특히 여러 마이크로서비스로 구성된 복잡한 솔루션 환경에서는 각 컴포넌트의 독립적인 개발과 동시에 전체 시스템의 통합성을 유지하는
현대 소프트웨어 개발에서 CI/CD(지속적 통합/지속적 배포) 파이프라인은 빠른 개발 사이클과 안정적인 배포를 위한 핵심 요소가 되었습니다. 특히 보안이 중요한 프로젝트에서는 VPN과 같은 보안 인프라를 CI/CD 파이프라인과 결합하는 것이 필수적입니다. 이 글에서는
클라우드 환경에서 프라이빗 리소스에 대한 안전한 접근 방식을 설계하는 것은 보안과 사용 편의성 사이의 균형을 맞추는 중요한 과제입니다. 특히 외부 고객사가 직접 AWS 리소스에 접근하여 설치 작업을 수행해야 하는 경우, 전통적인 방식으로는 보안 취약점이 발생할 수 있습
현대 클라우드 환경에서 인프라 관리와 애플리케이션 배포를 효율적으로 수행하는 것은 DevOps 엔지니어의 핵심 과제입니다. 특히 Kubernetes 환경에서 AI 워크로드를 안정적으로 운영하기 위해서는 인프라의 자동화와 표준화가 필수적입니다. 이 블로그에서는 Terra
클라우드 환경에서 효율적인 리소스 관리는 비용 최적화와 시스템 안정성 확보에 핵심적인 요소입니다. 특히 AWS EC2 인스턴스의 경우, 적절한 모니터링과 자동화된 관리 시스템을 구축함으로써 상당한 비용 절감과 운영 효율성을 높일 수 있습니다. 이번 프로젝트에서는 Eve
온프레미스와 AWS를 연동하는 하이브리드 클라우드 아키텍처를 설계 및 구축하여, GPU 인스턴스 비용 절감과 보안 강화를 달성한 프로젝트입니다.AWS (VPC, EC2, Route53, Site-to-Site VPN)KubernetesDockerMetalLBIngres
온라인 환경에서 파일 다운로드 OS에 맞는 패키지(rpm)를 다운로드 docker 각 OS별 rpm파일 다운로드 사이트 : Index of linux/ https://download.docker.com/favicon.ico contained.io
코드가 단순해지며, 한번만 작성할 수 있다한 곳에서만 코드를 변경하고 모든 인스턴스들에서는 변경사항만 확인할 수 있다시간과 노력이 절약되고 유지 관리가 쉬우며 버그 가능성도 줄어 든다같은 코드나 로직을 반복해서 작성하거나 복사하여 붙여넣기를 하는 행위코드와 로직을 재사
Amazon Route 53 은 가용성과 확장성이 뛰어난 클라우드 Domain Name System (DNS) 웹 서비스이다.Route 53는 도메인 구입부터 네임서버 등록까지 dns에 필요한 모든 기능이 있고, aws 답게 추가로 모니터링 기능까지 제공한다.다른 도메
AWS RDS란 관계형 데이터베이스를 간편하게 클라우드에서 설정, 운영, 확장이 가능하도록 지원하는 웹 서비스이다.RDS는 MySQL이나 오라클 같은 데이터베이스의 설치, 모니터링, 백업, 알람 등 관리를 대신해주며, 하드웨어 프로비저닝, 데이터베이스 설정, 패치 및