시스템 장애에 대하여

시스템을 운영하다 보면 심심치 않게 만나는 게 장애이다.

이는 예기치 않고 찾아오며
아무리 예방을 철저히 해도 찾아온다.
마치 마음의 빚처럼....,

여기서 벗어날 수는 없다.
중요한 점은 장애가 발생해도
서비스는 계속 되어야 한다는 점이다.

전투를 하다보면 사싱자가 발생 할 수도 있듯이
시스템을 운영하다보면 장애가 발생할 수 있다.

최소한의 서비스 중단을 위해 복구가 중요하다.
발생 후 복구까지 시간을 관리 해야한다.

그러기 위해서 장애발생 포인트 마다
시나리오를 작성하고 대응방안에 대한
주기적인 훈련이 중요하다.

훈련되면 습관처럼 움직이므로 장애조치에 많은 도움이 된다.

장애를 예방 할 수 있으면 좋지만 피할 수 없으므로 복구에 대한 시나리오를 작성해 놓아야 한다.

무조건 왜 빌생 했는지..., 문책하듯이 질문하는건 좋은 리더의 모습이 아닌거 같다.

댓글

이 블로그의 인기 게시물

한글 2010 에서 Ctrl + F10 누르면 특수문자 안뜰 때

아이폰에서 RFID 사용하는 방법

맥 화면이 안나올때 조치방법