GlusterFS là gì?

Hẳn là bây giờ các bạn cũng chẳng còn gì xa lạ với các thiết bị lưu trữ nữa rồi. Trên thị trường hiện nay có rất nhiều  loại thiết bị và giải pháp lưu trữ như HDD, SSD, NAS, USB … Dữ liệu của các bạn không chỉ được lưu trữ ở trên các thiết bị cá nhân hay máy tính cá nhân mà còn được lưu trữ cả trên những máy chủ để đảm bảo an toàn và có thể truy cập ở bất cứ đâu, bất cứ khi nào bạn cần. Hôm nay Làng công nghệ sẽ giới thiệu đến các bạn một giải pháp lưu trữ dữ liệu đồng thời trên nhiều máy chủ khác nhau đó chính là GlusterFS. Vậy GlusterFS là gì? Tính năng và hoạt động của nó ra sao? Cách cài đặt và sử dụng nó như thế nào?

GlusterFS là gì?

GlusterFS là một hệ thống tập tin mạng có thể mở rộng. Sử dụng phần cứng thông thường, bạn có thể tạo ra các giải pháp lưu trữ lớn, phân tán cho phương tiện truyền thông, phân tích dữ liệu và các công việc đòi hỏi nhiều dữ liệu và băng thông khác. GlusterFS là phần mềm miễn phí và mã nguồn mở.

I. Các thành phần cấu hình nên hệ thống lưu trữ GlusterFS:

  1. Node: Các máy chủ vật lý hoặc máy chủ ảo (Virtual Private Server) được cài đặt GlusterFS
  2. Brick: Trong tiếng Việt Brick có nghĩa là viên gạch, bạn có thể hiểu để xây nên một cái nhà, cần những viên gạch để ghép lại gắn kết bằng xi măng. Brick trong GlusterFS cũng vậy, là một đơn vị lưu trữ cơ bản, bản chất nó là một thư mục được Export ra từ một máy chủ nào đó. Ví dụ đây là một Brick: server1.langcongnghe.com:/folder/brick/
    Các bạn có thể hiểu server1.langcongnghe.com chính là máy chủ được cài đặt GlusterFS, và thư mục lưu trữ là /folder/brick/. Sau này hệ thống GlusterFS sẽ lưu trữ những tập tin tại thư mục này trên server này khi nó tham gia vào hệ thống.
  3. Volume: Gộp các Brick lại, bằng một cách nào đó theo bạn muốn (Giống như Raid trên các ổ cứng). Volume đóng vai trò quản lý các Brick được thêm vào nó. Và tất nhiên sau này bạn sẽ làm việc với Volume, bạn có thể coi nó là thư mục đích để lưu trữ dữ liệu vào đó.
  4. Client: Client là máy khách, các máy tính kết nối với hệ thống GlusterFS và thực hiện lưu trữ hoặc truy cập đến dữ liệu của GlusterFS. Khi bạn mount một Volume nào đó, thì bạn là một Client rồi đó.

II. Các dạng Volume của GlusterFS

Bạn có thể tạo 8 loại Volume trong GlusterFS

1. Distributed


Trong trường hợp này bạn có 3 tập tin File 1, File 2 và File 3, các tập tin sẽ được lưu trữ ngẫu nhiên trên mỗi Brick của mỗi Server. Ưu điểm của phương pháp này đó là giúp chia sẻ dung lượng lưu trữ của cả 2 server, và mỗi máy chủ sẽ chứa hoàn toàn mỗi tập tin mà nó có nhiệm vụ lưu trữ. Mọi sự cố xảy ra trên một server nào đó sẽ không ảnh hưởng đến các tập tin còn lại được lưu trữ trên server khác, chẳng hạn như server2 bị lỗi, thì chỉ có File 3 là không truy cập được thôi, còn File 1 và File 2 vẫn bình thường.

2. Replicated Volumes


Replicated Volumes lưu trữ các tập tin trên các Brick của mỗi server giống nhau. Vì có 2 server nên mỗi tập tin sẽ được sao chép thành 2 bản. Tương tự có 3 hay 4 server thì sẽ được sao chép tương ứng với số lượng server. Phương pháp này đảm bảo an toàn dữ liệu, giúp cho hệ thống lưu trữ có độ tin cậy cao và sẵn sàng.

3. Striped Volumes


Nhìn vào hình ảnh trên bạn có thể thấy, Tập tin cần lưu trữ được chia nhỏ thành nhiều phần, và mỗi phần nhỏ được lưu lần lượt trên các server tham gia vào hệ thống. Không có sự trùng lặp nào. Hầu hết được sử dụng trong trường hợp lưu trữ một tập tin lớn và cần sự truy xuất dữ liệu nhanh.
Nhược điểm: Server nào bị lỗi thì coi như tập tin đó không truy cập được nữa.

4. Distributed Striped Volumes


Nhìn vào hình trên bạn có thể thấy File 1 được chia nhỏ (Strip) và lưu trữ lần lượt trên mỗi Brick thuộc Server 1. Tương tự File 2 được chia nhỏ và lưu trữ lần lượt trên mỗi Brick thuộc server 2. File 1 và File 2 được lưu trữ phân tán trên 2 server. Phương pháp sử dụng cho các tập tin lớn được lưu trữ đồng thời trong hệ thống. Tận dụng được tiềm lực lưu trữ tối đa của mỗi máy chủ tham gia. Nhưng với mỗi Brick hỏng nó sẽ ảnh hưởng đến chính tập tin đã được Striped lưu trữ trên chính server đó.

5. Distributed Replicated Volumes


Các tập tin được lưu trữ phân tán, trên mỗi Volume Replicated chính bản thân tập tin lại được sao lưu trên các Brick của Volume Replicated. Mô hình trên sử dụng cho các tập tin quan trọng và cần hệ thống để có thể mở rộng lưu trữ dễ dàng, giúp truy xuất nhanh chóng đến các tập tin.

6. Striped Replicated Volumes


Nếu không chú ý kỹ, bạn có thể nhầm lẫn giữa các loại Volume trong GlusterFS. Đối với Striped Replicated Volumes. Tập tin lưu trữ thường rất lớn, nó vừa được chia nhỏ rải rác trên các Brick, đồng thời được sao lưu với mỗi phần được chia nhỏ. Điều này đảm bảo an toàn để lưu trữ tập tin có khối lượng lớn cũng như tốc độ truy xuất đến tập tin.

7. Dispersed Volumes


Tập tin được chia nhỏ thành nhiều phần và được mã hóa.

8. Distributed Dispersed Volumes


Các tập tin được chia nhỏ và các tập tin khác nhau được lưu trữ phân tán trên mỗi Volume Disperse.

Đó là 8 kiểu Volume mà bạn có thể cấu hình để sử dụng với GlusterFS.

III. Tại sao chúng ta dùng GlusterFS?

GlusterFS có rất nhiều ưu điểm so với các dạng hệ thống file server khác.

  1. Không có Metadata Server: Khi Client truy xuất dữ liệu không cần đến Metadata Server cho nên sẽ giảm được độ trễ, cũng như sự cố xảy ra với Metadata Server;
  2. Thêm một node khác vào Storage Pool trong GlusterFS rất dễ dàng, cho nên khả năng và tùy biến rất linh hoạt;
  3. Tính sẵn sáng và an toàn cao;
  4. Mã nguồn mở: GlusterFS là một mã nguồn mở, cho nên bạn sẽ được sử dụng miễn phí không tốn thêm chi phí nào, bạn cũng có thể nhận được sự hỗ trợ từ cộng đồng.

You May Also Like

About the Author: phongph

Trả lời