주요 포함 내용 요약:인프라 운영 및 관리: 멀티 클러스터 운영, 커널 파라미터 튜닝, 일상 운영(K8s, Cilium, AIStor 등).신규 구축 및 확장: 클러스터 및 AIStor 구축/업그레이드 계획.기술 고도화: KubeVirt

먼저 중점 준비 사항을, 그 다음 운영 체계 설계 전체를 시각화해서 보여드릴게요.파일의 65개 태스크를 전부 분석했습니다. 지금 여건에서 가장 먼저 잡아야 할 것과 어떻게 굴릴지를 순서대로 설명드릴게요.중점 준비 사항부터 말씀드리면, 크게 세 가지 이유에서 우선순위가
Kubernetes에서 특정 NFS 경로를 사용하는 PV(PersistentVolume)를 필터링하는 가장 효율적인 방법은 kubectl의 출력 형식을 활용하거나 jq를 사용하는 것입니다.상황에 맞는 몇 가지 명령어를 정리해 드립니다.PV 이름과 NFS 경로를 열 형태
서버에서 특정 포트를 "열어둔다"는 것은 두 가지 단계가 필요합니다. 첫 번째는 해당 포트를 점유하여 대기하는 프로세스(리스너)를 띄우는 것이고, 두 번째는 OS 방화벽에서 해당 포트로의 접근을 허용하는 것입니다.테스트용으로 빠르게 띄우는 방법과 방화벽 설정법을 정리해
전체 컨테이너화 + Nexus 등록 + K8s 배포 가이드를 작성했습니다.1단계 — 로컬 PC에서 빌드프로젝트 루트에 .env.build 파일에 Nexus 주소와 인증정보를 설정한 뒤 ./build/build-all.sh v1.2를 실행하면 5개 이미지(extracto
규모가 크고 중요한 설계 문서이므로, 전체 아키텍처와 핵심 코드를 포함한 단일 마크다운 파일로 작성합니다.전체 아키텍처 설계서와 핵심 코드를 담은 문서를 작성했습니다.8개 핵심 코드 모듈이 포함되어 있으며, 각각의 역할과 연결 구조는 다음과 같습니다.데이터 수집 → 정
Obsidian을 회사 서버에서 활용하는 것은 기술적으로 가능하며, 특정 워크플로우에서는 강력한 경쟁력을 가집니다. 다만, Obsidian은 본래 '로컬 퍼스트(Local-first)' 앱이기 때문에 Notion 같은 클라우드 기반 툴과는 서버 활용 방식이 조금 다릅니
MinIO AIStor Tables는 Apache Iceberg 테이블 포맷을 기반으로 하며, 객체 스토리지의 유연성과 관계형 데이터베이스의 강력한 쿼리 성능을 결합한 구조입니다. 제공해주신 문서를 바탕으로 Inventory API로 수집된 Parquet 파일을 Ice
이제 Replication 페이지와 Object Tiering 세부 페이지도 가져올게요.공식 docs 내용을 다 확인했어. 이제 요건에 맞는 Best Practice 안들을 정리할게.📌 Docs에서 확인한 중요 제약사항 먼저MinIO AIStor의 Object Tie
Lead DevOps이자 아키텍트로서 현재 128대(Hot) 규모에서 총 286대 규모로 확장하며, 성능(NVMe 추정)과 용량(SATA/SAS SSD)을 분리하는 매우 중요한 전환점에 서 계십니다. 단순히 용량을 늘리는 것을 넘어, 데이터의 생애주기(Lifecycle
apiVersion: batch/v1 kind: CronJob metadata: name: daily-task-2am spec: 매일 새벽 2시를 의미하는 크론 표현식 schedule: "0 2 * * *" jobTemplate: spec: template: spec: containers: ...
전문 인력이 운영하던 Cilium 환경을 인수인계받는 것은 상당히 난이도가 높은 작업입니다. Cilium은 단순히 CNI를 넘어 eBPF 기반의 보안, 라우팅, 관찰성(Observability)이 복합적으로 얽혀 있기 때문입니다.전임자에게 "운영 효율성"과 "장애 대응
이 분석은 현재 1,000대 규모의 대규모 Kubernetes 인프라와 Cilium(BGP/ECMP/ClusterMesh)을 운영하시는 환경에서 발생할 수 있는 가장 치명적이면서도 논리적인 시나리오입니다.기존에 의심했던 tcp_check_req DROP이 '원인'이 아
これは非常に重要な発見です。問題の方向が完全に逆でした。진짜 문제는 SYN-ACK의 귀환 경로(return path)입니다.Server가 SYN-ACK를 보낼 때, 목적지(Client IP)에 대한 라우팅을 다시 계산합니다. ECMP 환경에서는 이 경로가 SYN이 들어온 경
패킷이 외부 스위치에서 들어와 실제 애플리케이션(User Space)까지 도달하는 과정은 매우 복잡하지만, 플랫폼 엔지니어링 관점에서 중요한 '데이터의 전이 과정'을 중심으로 단계별로 정리해 드립니다.특히 현재 겪고 계신 native routing 및 Cilium eB
네, 개선 가능합니다. 튜닝의 방향은 크게 두 가지입니다. 하나는 SYN Cookie 모드로 진입 자체를 하지 않게 큐(Queue)를 늘리는 것이고, 다른 하나는 SYN Cookie가 동작하더라도 검증 실패가 나지 않도록 신뢰성을 높이는 것입니다.DevOps 관점에서

1,000노드 규모의 대규모 인프라에서 Cilium Native Mode와 BGP, ECMP를 조합해 사용하신다면, 네트워크 스택의 복잡도가 상당히 높을 것으로 예상됩니다. 특히 Asymmetric Routing(비대칭 라우팅)이나 ECMP Hashing 불일치가 간헐
제공해주신 pwru 트레이스 분석 결과와 상황을 종합해 볼 때, 이전 모델의 분석은 커널 내부의 흐름(Function Call Path) 관점에서는 정확하지만, 인프라 운영 측면에서는 '왜' 이런 일이 발생하는지에 대한 근본 원인(Root Cause)을 더 좁힐 필요가
#!/usr/bin/env python3 """ AIStor iNVENTORY Analyzer (원격 직접 읽기 버전) MinIO AIStor 버킷에 쌓인 iNVENTORY 결과를 로컬 복사 없이 Python에서 직접 스트리밍하여 분석합니다. 저장 경로 구조: ///// manifest.json files/ ...
두 개의 Parquet 파일을 합치는 방법은 크게 데이터를 메모리에 올려서 합치는 방식(Pandas/Polars)과 파일 시스템 수준에서 단순히 경로를 통합하는 방식이 있습니다. 교수님의 상황(MinIO에서 가져온 인벤토리 파일 처리)에서는 Pandas를 사용하는 것이