# SRE

15개의 포스트

SRE 란?

SRE란 Site Reliability Engineering의 약자로 조직이 시스템, 서비스 및 제품에서 적절한 수준의 안정성을 달성하도록 지원하는 엔지니어링 분야를 의미한다.SRE는 서비스의 인프라와 운영 관점의 문제를 소프트웨어 엔지니어링 기법을 통해 해결하고자 나

2022년 4월 17일
·
0개의 댓글
post-thumbnail

왜 인프라 관리 자동화가 필요한가?

어느 토요일 오전 , 기분좋게 운전을 하며 커피를 사러 가고 있었던 필자에게 한 통의 전화가 왔다. 다급한 목소리로 고객이 전화를 하니 곧바로 모든 마음의 안정과 원래 목적지에서 U턴을 해야했다. 보통 고객들은 ‘서비스가 안 된다’고 말을 하지 ‘웹서버 2번의 로그에서

2022년 3월 24일
·
0개의 댓글

SRE(Site Reliability Engineering)

2022년 3월 23일
·
0개의 댓글
post-thumbnail

AWX

AWX 는 Ansible 프로젝트 관리를 위한 웹 기반 사용자 인터페이스, REST API 및 Task 엔진 제공하는 툴이다. Red Hat Ansible Automation Platform 프로젝트 중에 하나 이며, 오픈소스로 제공하고 있다.AWX 자체는 Ansibl

2022년 3월 19일
·
0개의 댓글
post-thumbnail

Ansible 앤서블이란?

로 Puppet, Chef, Ansible, Saltstack 대표적이다.Ansible은 IaC (Infrastructure as Code)를 지향하는 자동화 관리 도구로 오픈 소스 기반으로 제작되었다.Ansible을 구동하는 모듈 및 라이브러리는 Python을 기반으

2022년 3월 19일
·
0개의 댓글
post-thumbnail

Zabbix - Ansible 연동

Zabbix 5.4 이상부터 ‘Trigger Action’ 에서 ‘Remote Command’ 선택이 활성화 되기 위해서는 Script를 먼저 등록해야 한다. 1.1 Zabbix > Administration > Scripts1.2 CREATE ITEM 을 클릭한다

2022년 3월 18일
·
0개의 댓글
post-thumbnail

Zabbix - Slack 연동 # 2.Zabbix item&trigger설정

3.1. Items 탭 클릭 후 CREATE ITEM 클릭 3.2 item은 모니터링하는 rule을 생성하는 개념이다3.3 Key부분에 select 버튼을 클릭한다.proc.num으로 특정 프로세스를 카운트 결과를 기준으로 모니터링 하기로 한다.proc.num

2022년 3월 18일
·
0개의 댓글
post-thumbnail

Zabbix Agent 등록

Zabbix Agent를 통한 모니터링은 Active 방식과 Passive 방식으로 나뉘어진다.사전조건으로 agent 설정 파일에서 serverActive의 ip를 지정해주어야 그 ip를 참조해서 데이터를 전송할 수 있다.Agent -> Server로 데이터를 전송하는

2022년 3월 18일
·
0개의 댓글
post-thumbnail

SRE APM Tool - Zabbix

AWS Ec2를 Ubuntu20.4로 생성한다. zabbix 구성 image들을 다운로드합니다.패스워드 주의restart 옵션이 없으므로, zabbix 서버 재부팅시 mysql 부터 시작해야 한다.좌측 메뉴 > Configuration > Hosts 열기Zabbix

2022년 3월 18일
·
0개의 댓글
post-thumbnail

SRE Practice

Put simply, SREs run services—a set of related systems, operated for users, who may be internal or external—and are ultimately responsible for the hea

2022년 3월 18일
·
0개의 댓글
post-thumbnail

SRE 원칙

이 섹션에서는 SRE 팀이 일반적으로 작동하는 방식의 기본 원칙 , 즉 SRE 운영의 일반적인 영역에 영향을 미치는 패턴, 행동 및 관심 영역을 검토합니다.이 섹션의 첫 번째 장이자 정확히 SRE가 하는 일과 이에 대해 추론하는 방법에 대한 가장 넓은 각도의 그림을 얻

2022년 3월 18일
·
0개의 댓글
post-thumbnail

SRE 소개

워크플로, 우선 순위 및 일상적인 작업의 뉘앙스가 SRE 팀마다 다르지만 모두 지원하는 서비스에 대한 기본 책임 세트를 공유하고 동일한 핵심 원칙을 준수합니다. 일반적으로 SRE 팀은 서비스의 가용성, 대기 시간, 성능, 효율성, 변경 관리, 모니터링, 비상 대응 및

2022년 3월 18일
·
0개의 댓글
post-thumbnail

SRE : Site Reliability Engineer

사이트 신뢰성 엔지니어링(SRE)은 IT 운영에 대한 소프트웨어 엔지니어링 접근 방식입니다. SRE 팀은 소프트웨어를 툴로 활용하여 시스템을 관리하고, 문제를 해결하고, 운영 태스크를 자동화합니다.SRE 팀은 기존에 운영 팀이 수동으로 하는 경우가 많았던 태스크를 받아

2022년 3월 18일
·
0개의 댓글

Dreaming-DevOps

안녕하세요Java개발자로 시작하여 현재 기업의 연구소에서 Devops, SRE 분야에 이제 꿈을 꾸기 시작한 codingdaddy 입니다.

2022년 3월 18일
·
0개의 댓글

[도서리뷰] SRE를 위한 시스템 설계와 구축

"한빛미디어 활동을 위해서 책을 제공받아 작성된 서평입니다." 저는 작은 개발팀을 리드하고 있는 개발자입니다. 이미 상당히 많은 시간을 코드 작성보다는 기타 업무에 시간을 쏟고 있어서 "내가 개발자라고 당당히 이야기 해도 되나?"하는 생각이 들때도 있지만, 여전히

2022년 2월 23일
·
0개의 댓글