공유할 서비스 선택

TECH


TECH

Middleware (Monitoring) Grafana를 활용한 batch cpu process minitoring 방법

페이지 정보

작성자 미들웨어 아이디로 검색 전체게시물 댓글 0건 조회 2,910회 좋아요 0회 작성일 21-03-27 17:10

본문

안녕하세요 "미들웨어" 입니다.

 

이번 장에서는 지난번 소개해드린 Grafana 를 활용해서 batch process 모니터링 활용방법에 대해 설명해보겠습니다.

 

실제로 상용 모니터링툴, 오픈소스 모니터링툴에서 batch cpu porcess 모니터링하는건 찾아보기 어렵습니다.

CPU는 증가하는데 어떤 활동으로 인해서 cpu 가 증가하는지 찾기가 어려운 거조..

예를들어 8core cpu 가 있다 하면 일반적으로 sys cpu와 user cpu 만 확인되고 어던 core 에 cpu 가 증가되서 총 cpu가 80%이상 사용하는지 확인이 어렵습니다

top 으로 확인은 가능하나 java 사용정도만 확인되는게 현실인거조..

그래서 한번 만들어서 사용해봤습니다. 

 

 

1. batch cpu process minitoring 을 구현 

Grafana + prometheus plugin 을 활용하면 아래 차트처럼 어떤 cpu로 인해 종합 cpu가 증가됐는지 확인해볼 수 있습니다.

아래 스샷처럼 구현에 필요한 사용 도구는 grafana 로 view를 구현했고 수집은 prometheus를 사용하고 agent에는 cpu exporter를 사용했습니다.

 

구현됐을때 성공한 batch cpu process 모니터링 대시보드 화면 입니다.

e26026272a3288ca90c68f68d34e2834_1616832217_8054.png
 

 

 

2. slack image 알람 구현

모니터링 구현에 도움이 되길 바라며 grafana + slack image 전송 내용을 작성해봤습니다

 

slack 로 알림을 보내는 기능은 grafana 를 찾아보시면 어렵지 않게 구현 가능합니다. 

slack hook 를 설정만 하면 되는데, 문제는 image를 아래 처럼 보내려면 이미지를 저장할 nas 가 필요합니다.

저는 AC3 아마존을 사용해서 알람 발생시 이미지를 AC3에 저장하고 그걸 slack 에 알람 내용과 함께 전송하였고 

성공했습니다.

성공된 이미지는 아래처럼 나옵니다.. 

e26026272a3288ca90c68f68d34e2834_1616832321_3751.png
 

 

위 처럼 slack 로 임계치설정을 한뒤 사용자가 설정한 수치 (예를들면 .. cpu 50%이상시 스샷 찍어서 slack로 알람전송) 를 자동으로 보내 확인한 사례입니다.

Grafana + promethous + slack + aws 저장소를 활용해봤습니다.

 

 

Grafana 에 대한 설계 구조는 지난 번 설명해드린 가이드 참고하시면 도움이 되실것 같네요 

http://www.chlux.co.kr/bbs/board.php?bo_table=board02&wr_id=117&sca=Middleware&page=2 

 

감사합니다

 

댓글목록

등록된 댓글이 없습니다.

TECH 목록
번호 제목 작성자 작성일 조회수
254 OS OSworker 아이디로 검색 전체게시물 06-29 46
앞으로 RHEL 에서는 핫(Hot) DR 경우만 유료 라고 합니다~ 웜(Warm), 콜드(Cold)는 무료~!!!

카테고리 : OS

46 0
작성자 : OSworker 25/06/29
253 OS OSworker 아이디로 검색 전체게시물 06-22 86
RHEL 10 에서 pacemaker가 어떤것이 변경되었는지 찾아봤습니다.

카테고리 : OS

86 0
작성자 : OSworker 25/06/22
252 OS OSworker 아이디로 검색 전체게시물 06-10 131
EUS 는 알겠는데 EEUS는 뭔가요? Enhanced Extended Update Support

카테고리 : OS

131 0
작성자 : OSworker 25/06/10
251 OS OSworker 아이디로 검색 전체게시물 05-28 203
RHEL10에 탑재되어있는 RHEL LIGHTSPEED 소개 #RHEL9.6도가능 #RHELAI

카테고리 : OS

203 0
작성자 : OSworker 25/05/28
250 OS OSworker 아이디로 검색 전체게시물 05-23 227
두번째 RHEL10 소개 - RHEL10 Lifecycle 소개 및 News

카테고리 : OS

227 0
작성자 : OSworker 25/05/23
249 OS OSworker 아이디로 검색 전체게시물 05-13 294
드디어 RedHat Enterprise Linux 10이 나왔습니다. #RHEL10

카테고리 : OS

294 0
작성자 : OSworker 25/05/13
248 OS OSworker 아이디로 검색 전체게시물 05-01 328
xsos라고 들어보셨나요? #sosreport

카테고리 : OS

328 0
작성자 : OSworker 25/05/01
247 OS OSworker 아이디로 검색 전체게시물 04-23 463
sarchart 라고 들어보셨나요? sar datat 를 좀더 보기 편하게 만들어줍니다.

카테고리 : OS

463 0
작성자 : OSworker 25/04/23
246 OS OSworker 아이디로 검색 전체게시물 04-16 629
Sosreport 생성시에 OS 의 모든 sar 데이터가 포함되지 않아요. 해결방법은?

카테고리 : OS

629 0
작성자 : OSworker 25/04/16
245 OS OSworker 아이디로 검색 전체게시물 03-29 766
이슈 : sbd watchdog type stonith 사용시 메모리 누수 발생 #RHEL8.10 #RHEL9.4

카테고리 : OS

766 0
작성자 : OSworker 25/03/29
Total 254건
게시물 검색

주식회사 클럭스| 대표 : 이찬호| 사업자등록번호 : 107-87-27655
주소 : 서울특별시 영등포구 국회대로 800, 여의도파라곤
E-mail : sales@chlux.co.kr
Copyright © 클럭스 www.chlux.co.kr All rights reserved.
상단으로Top