
OpenTelemetry Collector 같은 대형 프로젝트를 분석할 때 한 세션에서 전부 처리하려고 하면 문제가 생긴다.LLM은 컨텍스트 윈도우 안에서 처리하는 정보가 많아질수록 집중도가 떨어지고, 분석 퀄리티도 함께 낮아진다.

데이터 파이프라인 에이전트 — 어디서든 데이터를 받아서, 필요하면 가공하고, 어디든 보낼 수 있는 범용 수집기

상황: fix_plan.md에 "Django API 연동"이라고만 적었다.결과: Ralph가 localhost로 하드코딩해버렸다. WSL 환경에서 브라우저로 접근하면 동작하지 않는 코드였지만 지시에 환경 조건이 없었기 때문에 Ralph는 문제로 인식하지 못했다.교훈:

Ralph의 한계 1. 지시한 것만 한다 fix_plan.md에 적힌 것만 구현한다. 모호하게 적으면 모호하게 만들고, 누락한 건 신경 쓰지 않는다. 결국 품질은 fix_plan.md를 얼마나 잘 쓰느냐에 달려있다. 2. 테스트 범위를 스스로 설계하지 못한다 단위 테스트는 잘 작성하지만, 통합 테스트/E2E 테스트는 명시하지 않으면 안 만든다. 테스트가...
Ralph 사용 가이드 프로젝트 구조 Ralph를 쓰기 위해 필요한 것 1. CLAUDE.md "이 프로젝트가 뭔지" Claude에게 알려주는 파일. Claude는 세션 시작 시 이 파일을 자동으로 읽고 프로젝트 컨텍스트를 파악한다. 2. .ralph/fix_plan.md "뭘 만들어야 하는지" 할 일 목록. Ralph가 이 파일을 보고 순서대로 구...

MinIO S3 호환 오브젝트 스토리지다. AWS S3와 API가 동일해서 boto3 같은 S3 라이브러리를 그대로 쓸 수 있다. 로컬 또는 온프레미스 환경에서 S3처럼 파일을 저장하고 싶을 때 사용한다. 이 프로젝트에서는 Parquet 파일을 저장하는 스토리지로 사용한다. Apache Parquet 데이터를 저장하는 파일 형식이다. 컬럼 기반으로 ...

| 저장소 | 한 줄 정의 | | --- | --- | | DB (데이터베이스) | 현재 운영에 필요한 데이터를 빠르게 읽고 쓰기 위한 저장소 | | 데이터 웨어하우스 | 분석을 위해 정제·구조화된 데이터를 보관하는 저장소 | | 데이터 레이크 | 원시 데이터를 형식에 상관없이 대량으로 쌓아두는 저장소 | 쇼핑몰 데이터 예시 DB (일반 데이터베이스...

Django REST Framework(DRF)를 처음 쓰면 generics.ListCreateAPIView 한 줄로 GET/POST가 다 된다는 게 신기하면서도 불안하다.
Claude에서 MCP 서버를 구축하고 PostgreSQL 데이터베이스를 연동하는 실전 가이드MCP(Model Context Protocol) 는 Anthropic에서 개발한 표준 프로토콜로, Claude와 외부 데이터 소스를 연결하는 인터페이스임.MCP는 Claude

Django에서 사용할 수 있는 대표적인 CAPTCHA 3가지를 직접 테스트
Django에서 세션 저장소로 Redis Cluster를 사용하려고 django-redis를 설정했는데 아래 에러가 발생함. ClusterError: Command 분명히 Redis Cluster 구성도 잘 됐고, redis-py로 직접 테스트하면 잘 됨. 근
Redis 운영의 핵심은 "Master 노드가 죽었을 때 서비스가 얼마나 빨리, 자동으로 복구되느냐"임. 구성 방식에 따라 장애를 감지하고 복구하는 주체와 프로세스가 완전히 다름.각 방식별 Failover 메커니즘을 상세히 정리함.가장 기초적인 Master-Replic
Redis 도입 시 가장 먼저 하는 고민은 "어떤 아키텍처로 구성할 것인가?"임. 서비스 규모, 가용성(HA), 데이터 분산 필요성에 따라 크게 세 가지 방식(Replication, Sentinel, Cluster)으로 나뉨.각 방식의 특징과 장단점을 정리함.가장 기본
Docker Compose 기반 3-Node CrateDB 클러스터 구축 시 필수적인 핵심 개념(Node, Shard, Replica)과 장애 발생 시 자동 복구(Failover) 프로세스 정리.정의: 클러스터를 구성하는 하나의 서버 인스턴스(컨테이너).역할: 데이터
백엔드 개발하다 보면 Controller, Service, Repository 계층 구조에 익숙해짐.근데 비즈니스 로직이 복잡해질수록 Service가 비대해지거나, Controller가 너무 많은 Service를 호출하는 문제가 발생함.이럴 경우 사용해야 하는 것이 파

SQL 인터페이스를 통해 데이터베이스 내/외부 데이터로 예측 모델을 구축하고 쿼리할 수 있게 해주는 오픈 소스 플랫폼
Logstash를 사용하여 ElasticSearch에 2억건의 데이터를 indexing 과정에 OutOfMemoryError가 나옴CrateDB는 memory.breaker.limit 설정으로 각 쿼리에서 사용할 수 있는 메모리 상한선을 두고 있는데그 허용한도를 넘어버

기존의 회사 솔루션에 golang으로 만들어진 검색엔진이 처리하는 데이터가 많으면 느리다 라는 사용자의 요구사항으로 인해 ElasticSearch를 도입해보려고 함