profile
이것저것합니다
post-thumbnail

왜 컨테이너 런타임이 하나가 아닐까?

컨테이너 생태계에서 Docker runtime이 왜 하나로 통합되지 않고, 이미지별로 다른 runtime이 필요한지에 대해 의문이 들었습니다. 이를 이해하기 위해 OCI와 CRI의 개념을 중심으로 컨테이너 런타임의 역할과 구조를 정리해 보았습니다.주로 흔들리는 도커(D

2025년 1월 5일
·
0개의 댓글
·

2024.09.19 Neural Magic Office Hour 에서 확인하는 vLLM 아키텍처

vLLM은 asyncLLMEngine이라는 클래스를 사용해 요청을 처리하며, 이 엔진은 Continous Batching을 담당합니다. LLM 엔진은 VM 내부에서 작동하며, 루프를 실행하는데, 이 루프는 세 가지 단계로 구성됩니다: 첫 번째는 스케줄링(Scheduling), 두 번째는 실행(Executing), 세 번째는 출력 처리(Processing...

2024년 11월 15일
·
0개의 댓글
·
post-thumbnail

성능테스트

서비스 API 를 생성한 개발자 중에, 부하테스트를 하고자하는 분들을 위해, 해당 글을 작성하였습니다. 해당 페이지를 읽고 나시면, 성능테스트의 개념, 성능테스트 도구의 종류에 대해 이해하실 수 있습니다.다중사용자 지원 능력을 평가하는데 흔히 세 가지 유형의 성능 테스

2024년 11월 3일
·
0개의 댓글
·
post-thumbnail

2024년 4분기의 시작, 글또 10기 다짐글

벌써 2024년 4분기의 시작이에요. 시간이 정말 빠르게 지나가는 것 같아요. 올해를 돌이켜보면, 여러 가지 생각이 드네요. 특히 지표의 중요성에 대해 많이 고민했던 한 해였던 것 같아요. 오픈서치에 대해 공부하고, SRE에 대한 고민도 많이 했던 것 같아요. 최근 가

2024년 10월 12일
·
0개의 댓글
·