사이트 신뢰성 엔지니어(Site Reliability Engineer)란 소프트웨어 엔지니어링 방식을 인프라 운영 문제에 적용해 확장 가능하고 안정적인 소프트웨어 시스템을 만드는 역할이다. 특히 성능을 개선하고 사고의 영향을 줄이고자 사전 예방적 조처를 한다. 운영 성
무엇이 중요한지를 알면 중요하지 않은 것을 배제할 수 있다. 중요한 것을 판단하기 위해 참고할 만한 좋은 자료는 구글의 사이트 안정성 엔지니어링(Site Reliability Engineering, SRE) 팀이다. 이 그룹이 작성하고 벳시 베이어 등이 편집한 “사이트