한 주 회고 - 4 회차

kimjayhyun·2025년 6월 1일

한 주 회고

목록 보기
4/12

5 월 17 일

발표자료: [[Mornitoring 구축]]

🗓 이번 주 요약

  1. 운영서버 패치 지원

    • 5/14(수) ~ 5/17(금)

    • 솔루션 패치 내역 정리 및 패키징

      • NVIDIA GPU Driver
      • 솔루션 Docker image 준비 등...
    • 패치 작업을 위한 테스트 서버 구축

      • redhat 8.3 버전이 너무 오래되어 실패

        • eos & eol - 2021 년까지 지원

          • nvidia gpu driver 설치 중 os kernel version이 너무 낮아 에러가 발생
          • os kernel version을 높히거나 낮추기 위해선 yum or dnf가 아닌
            rpm 파일을 다운로드 받아야 했음
[baseos]
name=Rocky Linux $releasever - BaseOS
mirrorlist=https://mirrors.rockylinux.org/mirrorlist?arch=$basearch&repo=BaseOS-$releasever$rltype
#baseurl=http://dl.rockylinux.org/$contentdir/$releasever/BaseOS/$basearch/os/
gpgcheck=1
enabled=1
countme=1
metadata_expire=6h
gpgkey=file:///etc/pki/rpm-gpg/RPM-GPG-KEY-Rocky-9
  1. kubernetes 마이그레이션 및 환경 재구축

    • 몇 개의 솔루션을 k8s으로 마이그레이션하여 구동하는 것을 확인하였음

    • xfs type의 파일시스템의 파일 용량을 늘리다가 잘못해서 mount가 되지 않음...

      • xfs 파일시스템은 용량을 줄이는 것이 불가능함
      • 용량을 줄이는 명령어를 사용했다가 죽어버림...
  • 파일시스템 손상으로 판단
    • OS 재설치 완료
      • os 설치 시, filesystem 구성을 변경하여 설치하였음
    • ansible 사용 예정
    • containerd & nvidia container toolkit 사용 방법 확인 예정
  1. gitlab cicd 환경 구축
    • gitlab cicd runner 등록 완료
    • 빌드 환경 구축 예정(artifact)
  1. FaskAPI SDK 완료
    • 활용한 KMS 서버 개발 예정
    • 추가 기능 받을 예정

💻 진행한 작업 / 학습

작업

  • 서버 패치를 위한 패키징 작업 및 작업 내역서 작성
  • k8s 환경 구축을 위한 PC 세팅

학습

  • github action 학습 완료
    - 최종 내용 정리 필요
    - gitlab cicd를 활용한 사내 작업 자동화 예정

  • prometheus 강의 혹은 next 강의 들을 예정

✅ 잘된 점

  • 서버 작업에 대한 디버깅
  • 서버에 파일 반입 절차가 편했음

⚠️ 어려웠던 점 / 고민 지점

  • 솔루션 패치를 테스트할 수 있는 서버 구축이 어려웠음
  • 우리 솔루션의 서비스 모니터링 구축

🔧 개선 방향 / 요청 사항

  • 그래도 패치 작업은 최선을 선택해서 진행했던 것 같음

🔭 다음 주 계획

  • 출장 작업 내역서 작성
  • mornitoring 환경 구축 테스트
  • k8s 환경 재구축 및 마이그레이션 진행
  • KMS 서버 내용 정리

0개의 댓글