Hệ thống nhắn tin tự động cảnh báo tình trạng hoạt động các ứng dụng

16:43 - 31/12/2018  |  273 lượt xem

Chia sẻ Chia sẻ
Hiện nay số lượng máy chủ các phần mềm ứng dụng phục vụ sản xuất kinh doanh của EVNCPC ngày càng nhiều (ví dụ như: CMIS3 là 23 máy chủ, CPC-eOffice là 33 máy chủ, …). Để nắm bắt nhanh chóng khả năng có thể phát sinh sự cố để phòng ngừa và kịp thời xử lý, ngoài việc bộ phận NOC thuộc CPCITC trực giám sát 24/7 về tình trạng của toàn bộ hệ thống thì CPCITC cũng đã tích hợp hệ thống SMS Gateway hiện có vào chương trình giám sát Solarwinds nhằm nhắn tin tự động kịp thời các cảnh báo trong hệ thống giám sát Solarwinds đến các bộ phận vận hành.
Hệ thống nhắn tin tự động cảnh báo tình trạng hoạt động các ứng dụng

Sơ đồ Logic luồng dữ liệu từ hệ thống giám sát đến cán bộ vận hành

Các cảnh báo cơ bản đang được thiết lập để thực hiện gửi SMS từ hệ thống giám sát Solarwinds đến cán bộ quản trị vận hành:

  • Cảnh báo về trạng thái “Node”
  • Cảnh báo về trạng thái CPU, RAM của “Node” sử dụng quá ngưỡng 80%
  • Cảnh báo về trạng thái DISK của “Node” sử dụng quá ngưỡng 80%
  • Cảnh báo về trạng thái “Service”

Cơ chế hoạt động nhắn tin cảnh báo như sau:

Bước 1: Thiết lập cấu hình các ngưỡng cảnh báo theo các nhóm điều kiện được đặt ra trong chương trình Solarwinds.

Bước 2: Thiết lập “action” các cảnh báo về số điện thoại của cán bộ vận hành chương trình, hệ thống. Cài đặt các biến phù hợp vào trong cú pháp nhắn tin.

Bước 3: Khi có một sự kiện nào đó khớp với nhóm điều kiện được thiết lập thì hệ thống Solarwinds sẽ cảnh báo.

Bước 4: Sau khi kiểm tra đúng với các điều kiện được thiết lập trong cảnh báo của Solarwinds thì hệ thống Solarwinds sẽ gọi một service đến hệ thống SMS Gateway.

Nội dung tin nhắn tùy thuộc vào từng chương trình ứng dụng hay hệ thống mà người quản trị cấu hình các biến thích hợp vào chương trình giám sát Solarwinds, sao cho nội dung tin nhắn cán bộ vận hành nhận được là rõ ràng và tường minh nhất.

Ví dụ tin nhắn từ hệ thống giám sát Solarwinds thông qua SMS Gateway đến cán bộ vận hành với nội dung Ram sử dụng quá 80%:

Cảnh báo Ram sử dụng quá 80%

Ví dụ tin nhắn từ hệ giám sát Solarwinds thông qua SMS Gateway đến cán bộ vận hành với nội dung một Node mạng trong hệ thống bị “Down”:

Cảnh báo Node mạng trong hệ thống bị “Down”

Ví dụ tin nhắn từ hệ giám sát Solarwinds thông qua SMS Gateway đến cán bộ vận hành với tình trạng hoạt động của một “service”:

Tình trạng hoạt động của một “service”

Với hệ thống nhắn tin cảnh báo sớm một số nguy cơ có thể xảy ra trong hệ thống, đã góp phần giúp các bộ phận vận hành của CPCITC phát hiện, ngăn ngừa và kịp thời xử lý sự cố nhằm duy trì hệ thống mạng và các ứng dụng hoạt động thông suốt 24/7 để phục vụ người sử dụng trong toàn Tổng Công ty ngày càng tốt hơn.

Vương Thông - Lê Bá Trình

16:43 - 31/12/2018  |  273 lượt xem

Chia sẻ Chia sẻ

TIN BÀI ĐỌC NHIỀU