Greenplum: Cách khắc phục sự cố khi chạy Quy trình sao lưu cơ sở dữ liệu

2022-10-22 23:13:32

Greenplum dựa trên kiến trúc MPP (xử lý song song hàng loạt). Nó được xây dựng dựa trên xử lý song song chế độ không chia sẻ, trong đó tất cả các phân đoạn con sở hữu các tài nguyên riêng biệt.

Database Theory: Xử lý truy vấn song song (Hệ thống cơ sở dữ liệu song song) là gì?

Khi bạn đang sao lưu cơ sở dữ liệu trong Greenplum, nó thực hiện quá trình sao lưu theo các giai đoạn khác nhau và thực hiện song song.

Đối với GP DBA, điều này rất quan trọng để biết rằng quá trình sao lưu phân đoạn hoặc máy đang chạy. Họ có thể có một số câu hỏi khác như Quá trình sao lưu đã hoàn tất cho một phân đoạn chính chưa ?, Nếu quá trình này đã hoàn tất cho một phân đoạn chính, nó hiện đang chạy ở phân đoạn con nào.

Bạn có thể truy cập bài viết này để khắc phục sự cố Greenplum đang chạy quá trình sao lưu cơ sở dữ liệu.

Bạn có thể bắt đầu sao lưu cơ sở dữ liệu đầy đủ của Greenplum bằng lệnh dưới đây:

Trước tiên, nó cần một bản sao lưu của nút chính (tất cả siêu dữ liệu hoặc pg_catalog), trong khi trong thời gian này, bạn không thể thực hiện bất kỳ DDL hoặc bất kỳ hoạt động nào khác trên máy chủ cơ sở dữ liệu Greenplum như TẠO BẢNG, BẢNG DROP, BẢNG TRUNCATE.
Chỉ mất vài phút để hoàn thành việc sao lưu một nút chính.

Làm thế nào bạn có thể kiểm tra điều đó, Quá trình sao lưu cơ sở dữ liệu Greenplum có đang chạy trên nút chính không?

The first step is to check if the message “Starting Dump process” is on the screen
After this message, you can find a subsequent message “Releasing pg_class lock” that means backup process completed for master segment (meta data backup).

Bạn có thể đo chênh lệch thời gian giữa "Bắt đầu quy trình Dump" và "Giải phóng khóa pg_class", đó là tổng thời gian cần thiết để sao lưu phân đoạn chính.

Nếu bạn không thể tìm thấy "Đang giải phóng khóa pg_class" trên màn hình và chỉ tìm thấy "Đang bắt đầu quy trình Dump" trong một thời gian dài, thì 99% là sự cố với phân đoạn chính và các sự cố như khóa cơ sở dữ liệu, sự cố mạng, lỗi đĩa.

Làm thế nào chúng ta có thể kiểm tra điều đó, Quá trình sao lưu cơ sở dữ liệu Greenplum có đang chạy trên các nút con không?

Sau khi sao lưu một nút chính, lệnh gp_dump sẽ được gửi đến tất cả các phân đoạn để bắt đầu sao chép dữ liệu bằng lệnh COPY.

Chúng tôi có thể kiểm tra các quy trình đang chạy trong các nút con và có thể tìm thấy lệnh COPY và thư mục db_dumps trong danh sách quy trình. Bạn có thể lấy danh sách các tiến trình đang chạy của Linux bằng lệnh: ps -ef.
Dưới đây là thông báo quy trình mẫu:

Lưu ý quan trọng:

Vui lòng không hủy bản sao lưu Greenplum đang chạy dài chỉ từ nút chính vì nó có thể tiếp tục quá trình sao lưu trên các phân đoạn con. Một lệnh giết sai của bạn có thể làm hỏng toàn bộ cụm Greenplum của bạn.


Nếu các bạn biết cách diệt backup chạy dài trong Greenplum, vui lòng chia sẻ đầy đủ thông tin chi tiết với mình vì mình cũng đang tìm giải pháp để diệt quá trình backup ở tất cả các phân khúc con.

Xem thêm:


Chia sẻ: