모니터링 시스템 구축기 [Telegraf + Prometheus + Grafana]
·
DevOps/Infra
서론현재 사내 대부분의 서비스는 네이버 클라우드 플랫폼 기반 다양한 인스턴스들에 분배돼 있다. 그동안 각 서버의 정보를 구글 시트에 수동으로 기록하며 관리해 왔으나, 서버 상태를 실시간으로 확인하거나 일괄적으로 관리하기에는 다소 불편함이 있었다. 요구사항은 아래와 같다서버 상태 모니터링 (서버의 작동 유무, 성능 지표)프로그램 관리 (서버에 설치된 프로그램 목록, 서비스 상태)SSL 인증서 관리 (만료일 모니터링 및 알림)로그 관리 (서버 로그 수집 및 모니터링, 검색)알림 시스템 (서비스가 중단되거나 성능 지표가 임계값을 초과할 때 알림)원격 명령 실행 (SSH를 통한 원격 서버 명령 실행)사용자 관리 (그룹 생성 및 그룹별 권한)대시보드 (상기 항목들을 시각화하여 조회)이러한 요구사항 대부분을 그라파..