SRE 원칙

CodingDaddy·2022년 3월 18일
0
post-thumbnail

이 섹션에서는 SRE 팀이 일반적으로 작동하는 방식의 기본 원칙 , 즉 SRE 운영의 일반적인 영역에 영향을 미치는 패턴, 행동 및 관심 영역을 검토합니다.

이 섹션의 첫 번째 장이자 정확히 SRE가 하는 일과 이에 대해 추론하는 방법에 대한 가장 넓은 각도의 그림을 얻으려면 읽어야 할 가장 중요한 부분은 위험 수용 입니다. 서비스 관리에 유용하게 중립적인 접근 방식을 제공하기 위해 평가, 관리 및 오류 예산 사용이라는 위험의 렌즈를 통해 SRE를 살펴봅니다.

서비스 수준 목표는 SRE의 또 다른 기본 개념 단위입니다. 업계는 일반적으로 서비스 수준 계약이라는 일반적인 기치 아래 이질적인 개념을 묶어서 이러한 개념을 명확하게 생각하기 어렵게 만드는 경향이 있습니다. 서비스 수준 목표 는 계약의 목표에서 지표를 분리하려고 시도하고 SRE가 이러한 각 용어를 사용하는 방법을 조사하고 자체 애플리케이션에 유용한 메트릭을 찾는 방법에 대한 몇 가지 권장 사항을 제공합니다.

수고 제거는 SRE의 가장 중요한 작업 중 하나이며 수고 제거 의 주제입니다 . 우리는 수고 를 서비스 성장에 따라 선형적으로 확장되는 지속적인 가치를 제공하지 않는 일상적이고 반복적인 운영 작업으로 정의합니다.

Google이든 다른 곳이든 모니터링은 프로덕션에서 올바른 작업을 수행하는 데 절대적으로 필수적인 구성 요소입니다. 서비스를 모니터링할 수 없으면 무슨 일이 일어나고 있는지 알 수 없고, 무슨 일이 일어나고 있는지 알지 못하면 신뢰할 수 없습니다. 모니터링 대상 및 방법에 대한 몇 가지 권장 사항과 구현에 구애받지 않는 모범 사례를 보려면 분산 시스템 모니터링 을 읽으십시오 .

Evolution of Automation at Google 에서 우리는 자동화 에 대한 SRE의 접근 방식을 검토하고 SRE가 자동화를 성공적으로 구현한 방법과 성공하지 못한 방법에 대한 몇 가지 사례 연구를 살펴봅니다.

대부분의 회사는 릴리스 엔지니어링을 사후 고려 사항으로 취급합니다. 그러나 릴리스 엔지니어링 에서 배우게 될 것처럼 릴리스 엔지니어링은 전체 시스템 안정성에만 중요한 것은 아닙니다. 대부분의 중단은 일종의 변경을 추진하는 데서 발생하기 때문입니다. 릴리스의 일관성을 보장하는 가장 좋은 방법이기도 합니다.

신뢰성 지향 엔지니어링뿐만 아니라, 모든 효과적인 소프트웨어 엔지니어링의 핵심 원칙은 단순성은 한 번 잃어버리면 다시 되찾기 매우 어려운 품질입니다. 그럼에도 불구하고 오래된 속담에 따르면 작동하는 복잡한 시스템은 작동하는 간단한 시스템에서 필연적으로 진화했습니다. 단순성은 이 주제에 대해 자세히 설명합니다.

출처

profile
Creative - DevOps in Korea

0개의 댓글