26M13b

주요 포함 내용 요약:인프라 운영 및 관리: 멀티 클러스터 운영, 커널 파라미터 튜닝, 일상 운영(K8s, Cilium, AIStor 등).신규 구축 및 확장: 클러스터 및 AIStor 구축/업그레이드 계획.기술 고도화: KubeVirt

1일 전
·
0개의 댓글
·
post-thumbnail

26M13a

먼저 중점 준비 사항을, 그 다음 운영 체계 설계 전체를 시각화해서 보여드릴게요.파일의 65개 태스크를 전부 분석했습니다. 지금 여건에서 가장 먼저 잡아야 할 것과 어떻게 굴릴지를 순서대로 설명드릴게요.중점 준비 사항부터 말씀드리면, 크게 세 가지 이유에서 우선순위가

1일 전
·
0개의 댓글
·

26A30a

Kubernetes에서 특정 NFS 경로를 사용하는 PV(PersistentVolume)를 필터링하는 가장 효율적인 방법은 kubectl의 출력 형식을 활용하거나 jq를 사용하는 것입니다.상황에 맞는 몇 가지 명령어를 정리해 드립니다.PV 이름과 NFS 경로를 열 형태

2026년 4월 29일
·
0개의 댓글
·

26A29d

서버에서 특정 포트를 "열어둔다"는 것은 두 가지 단계가 필요합니다. 첫 번째는 해당 포트를 점유하여 대기하는 프로세스(리스너)를 띄우는 것이고, 두 번째는 OS 방화벽에서 해당 포트로의 접근을 허용하는 것입니다.테스트용으로 빠르게 띄우는 방법과 방화벽 설정법을 정리해

2026년 4월 29일
·
0개의 댓글
·

26A29c

전체 컨테이너화 + Nexus 등록 + K8s 배포 가이드를 작성했습니다.1단계 — 로컬 PC에서 빌드프로젝트 루트에 .env.build 파일에 Nexus 주소와 인증정보를 설정한 뒤 ./build/build-all.sh v1.2를 실행하면 5개 이미지(extracto

2026년 4월 28일
·
0개의 댓글
·

26A29b

규모가 크고 중요한 설계 문서이므로, 전체 아키텍처와 핵심 코드를 포함한 단일 마크다운 파일로 작성합니다.전체 아키텍처 설계서와 핵심 코드를 담은 문서를 작성했습니다.8개 핵심 코드 모듈이 포함되어 있으며, 각각의 역할과 연결 구조는 다음과 같습니다.데이터 수집 → 정

2026년 4월 28일
·
0개의 댓글
·

26A29a

Obsidian을 회사 서버에서 활용하는 것은 기술적으로 가능하며, 특정 워크플로우에서는 강력한 경쟁력을 가집니다. 다만, Obsidian은 본래 '로컬 퍼스트(Local-first)' 앱이기 때문에 Notion 같은 클라우드 기반 툴과는 서버 활용 방식이 조금 다릅니

2026년 4월 28일
·
0개의 댓글
·

26A27d

MinIO AIStor Tables는 Apache Iceberg 테이블 포맷을 기반으로 하며, 객체 스토리지의 유연성과 관계형 데이터베이스의 강력한 쿼리 성능을 결합한 구조입니다. 제공해주신 문서를 바탕으로 Inventory API로 수집된 Parquet 파일을 Ice

2026년 4월 27일
·
0개의 댓글
·

26A27c

이제 Replication 페이지와 Object Tiering 세부 페이지도 가져올게요.공식 docs 내용을 다 확인했어. 이제 요건에 맞는 Best Practice 안들을 정리할게.📌 Docs에서 확인한 중요 제약사항 먼저MinIO AIStor의 Object Tie

2026년 4월 27일
·
0개의 댓글
·

26A27b

Lead DevOps이자 아키텍트로서 현재 128대(Hot) 규모에서 총 286대 규모로 확장하며, 성능(NVMe 추정)과 용량(SATA/SAS SSD)을 분리하는 매우 중요한 전환점에 서 계십니다. 단순히 용량을 늘리는 것을 넘어, 데이터의 생애주기(Lifecycle

2026년 4월 27일
·
0개의 댓글
·

26A24a

apiVersion: batch/v1 kind: CronJob metadata: name: daily-task-2am spec: 매일 새벽 2시를 의미하는 크론 표현식 schedule: "0 2 * * *" jobTemplate: spec: template: spec: containers: ...

2026년 4월 24일
·
0개의 댓글
·

26A23c

전문 인력이 운영하던 Cilium 환경을 인수인계받는 것은 상당히 난이도가 높은 작업입니다. Cilium은 단순히 CNI를 넘어 eBPF 기반의 보안, 라우팅, 관찰성(Observability)이 복합적으로 얽혀 있기 때문입니다.전임자에게 "운영 효율성"과 "장애 대응

2026년 4월 23일
·
0개의 댓글
·

26A23b

이 분석은 현재 1,000대 규모의 대규모 Kubernetes 인프라와 Cilium(BGP/ECMP/ClusterMesh)을 운영하시는 환경에서 발생할 수 있는 가장 치명적이면서도 논리적인 시나리오입니다.기존에 의심했던 tcp_check_req DROP이 '원인'이 아

2026년 4월 22일
·
0개의 댓글
·

26A23a

これは非常に重要な発見です。問題の方向が完全に逆でした。진짜 문제는 SYN-ACK의 귀환 경로(return path)입니다.Server가 SYN-ACK를 보낼 때, 목적지(Client IP)에 대한 라우팅을 다시 계산합니다. ECMP 환경에서는 이 경로가 SYN이 들어온 경

2026년 4월 22일
·
0개의 댓글
·

26A21d

패킷이 외부 스위치에서 들어와 실제 애플리케이션(User Space)까지 도달하는 과정은 매우 복잡하지만, 플랫폼 엔지니어링 관점에서 중요한 '데이터의 전이 과정'을 중심으로 단계별로 정리해 드립니다.특히 현재 겪고 계신 native routing 및 Cilium eB

2026년 4월 20일
·
0개의 댓글
·

26A21c

네, 개선 가능합니다. 튜닝의 방향은 크게 두 가지입니다. 하나는 SYN Cookie 모드로 진입 자체를 하지 않게 큐(Queue)를 늘리는 것이고, 다른 하나는 SYN Cookie가 동작하더라도 검증 실패가 나지 않도록 신뢰성을 높이는 것입니다.DevOps 관점에서

2026년 4월 20일
·
0개의 댓글
·
post-thumbnail

26A21b

1,000노드 규모의 대규모 인프라에서 Cilium Native Mode와 BGP, ECMP를 조합해 사용하신다면, 네트워크 스택의 복잡도가 상당히 높을 것으로 예상됩니다. 특히 Asymmetric Routing(비대칭 라우팅)이나 ECMP Hashing 불일치가 간헐

2026년 4월 20일
·
0개의 댓글
·

26A21a

제공해주신 pwru 트레이스 분석 결과와 상황을 종합해 볼 때, 이전 모델의 분석은 커널 내부의 흐름(Function Call Path) 관점에서는 정확하지만, 인프라 운영 측면에서는 '왜' 이런 일이 발생하는지에 대한 근본 원인(Root Cause)을 더 좁힐 필요가

2026년 4월 20일
·
0개의 댓글
·

26A10d

#!/usr/bin/env python3 """ AIStor iNVENTORY Analyzer (원격 직접 읽기 버전) MinIO AIStor 버킷에 쌓인 iNVENTORY 결과를 로컬 복사 없이 Python에서 직접 스트리밍하여 분석합니다. 저장 경로 구조: ///// manifest.json files/ ...

2026년 4월 10일
·
0개의 댓글
·

26A10c

두 개의 Parquet 파일을 합치는 방법은 크게 데이터를 메모리에 올려서 합치는 방식(Pandas/Polars)과 파일 시스템 수준에서 단순히 경로를 통합하는 방식이 있습니다. 교수님의 상황(MinIO에서 가져온 인벤토리 파일 처리)에서는 Pandas를 사용하는 것이

2026년 4월 10일
·
0개의 댓글
·