Ý tưởng Graph Database – giải pháp kết nối, mô tả dữ liệu dưới dạng đồ thị

16:03 - 01/10/2021  |  347 lượt xem

Chia sẻ
Hiện nay, công tác chuyển đổi số trong Tập đoàn Điện lực Việt Nam đang diễn ra vô cùng mạnh mẽ, một số hệ thống đã được phát triển để ứng dụng thống nhất trong toàn EVN như: CMIS, OMS, PMIS.... Tuy nhiên, đa số việc phát triển các hệ thống mới tại các đơn vị thành viên vẫn còn theo hướng giải quyết cho từng nghiệp vụ riêng lẻ, độc lập và chưa có sự kết nối với các hệ thống khác để có thể tận dụng, cung cấp thông tin cho hệ thống cần phát triển. Chính vì khối lượng dữ liệu lớn, phức tạp được phân tán trên nhiều nguồn, ông Lê Văn Tường – Giám đốc Trung tâm Chăm sóc khách hàng Điện lực miền Trung (CPCCC) đã đề xuất sử dụng Graph Database như một giải pháp hữu ích để giải quyết tình trạng trên.
Ý tưởng Graph Database – giải pháp kết nối, mô tả dữ liệu dưới dạng đồ thị

Minh họa mô hình Graph Database

Graph Database hay còn gọi là cơ sở dữ liệu đồ thị được thiết kế để xem các mối quan hệ giữa các dữ liệu là quan trọng như nhau đối với bản thân dữ liệu. Nó giúp lưu trữ dữ liệu mà không cần tạo thành một mô hình được xác định trước. Thay vào đó, dữ liệu được lưu trữ giống như lần đầu tiên chúng ta vẽ ra – cho biết cách mỗi thực thể riêng lẻ kết nối với hoặc có liên quan với những thực thể khác. Trong khi các cơ sở dữ liệu khác tính toán các mối quan hệ tại thời điểm truy vấn thông qua các hoạt động JOIN tốn kém, thì cơ sở dữ liệu đồ thị lưu trữ các kết nối cùng với dữ liệu trong mô hình. Truy cập các nút và mối quan hệ trong cơ sở dữ liệu đồ thị gốc là một hoạt động hiệu quả, thời gian liên tục và cho phép nhanh chóng duyệt qua hàng triệu kết nối mỗi giây trên mỗi lõi.

Dựa vào việc xây dựng middleware API cung cấp khả năng khai thác dữ liệu với mức độ tùy biến cao nhất sẽ cho phép các hệ thống khác vừa có thể sử dụng, đồng thời tận dụng được tối đa hiện trạng dữ liệu sẵn có. Để thực hiện, người dùng cần mô hình hóa dữ liệu hiện có của từng chương trình riêng rẽ thành các đối tượng cụ thể, rồi tiến hành chọn trên mỗi hệ thống một dữ liệu chủ (Master data, master table) tương tự hiệu ứng Domino; kết nối, mô tả các dữ liệu chủ và sử dụng công cụ Visualize Data để lập nên các hệ thống tra cứu các mối liên hệ giữa các dữ liệu đã liên kết. Tuy nhiên, để các hệ thống khác có thể sử dụng được những dữ liệu đã liên kết, các middeware API cần có khả năng truy vấn theo GraphQL. Với ngôn ngữ này, các hệ thống có khả năng tra cứu dữ liệu từ các nguồn khác nhau chỉ bằng một câu truy vấn duy nhất. Hệ thống middleware sẽ giải quyết và tìm kiếm dữ liệu theo Graph đã được liên kết. Ngoài ra nhà phát triển có thể tùy chọn các trường dữ liệu nhận về theo từng mục đích cụ thể của từng hệ thống.

Mô hình kết nối dựa trên middleware

Cuối cùng, khi người dùng phát sinh các báo cáo mới hoặc phát triển một chương trình mới, mô hình cho phép tạo ra các báo cáo mang tính phức tạp cao về số liệu nhờ vào những liên kết sẵn có từ các hệ thống. Mô hình này cũng cho phép truy tìm các lỗi số liệu nhanh chóng với các truy vấn đồ thị nhanh.

Xu hướng Big Data đang trở nên ngày càng phổ biến. Sự phát triển của nó kéo theo sự thay đổi về tư duy cũng như các xu hướng công nghệ. Chúng ta có thể đã nghe đâu đó về việc xây dựng Data Lake, Data Warehouse. Tuy nhiên, việc xây dựng mô hình Graph Database là tiền đề để tạo lập, chuyển đổi và khai phá dữ liệu, đặc biệt là ứng dụng trong Tập đoàn Điện lực Việt Nam với nhiều chương trình, hệ thống dùng chung có quy mô dữ liệu khổng lồ. Đây cũng là một giải pháp tiết kiệm, có tính ứng dụng cao và vô cùng linh động.

Bảo Hạnh - Việt An

16:03 - 01/10/2021  |  347 lượt xem

Chia sẻ

TIN BÀI ĐỌC NHIỀU