Vì sao blockchain quan trọng với ngành lưu trữ dữ liệu

Mọi người giờ đây có thể cho thuê và kiếm tiền từ phần không gian ổ cứng không dùng đến. Khả năng tận dụng dung lượng lưu trữ dư thừa ngày càng trở nên thực tế hơn khi nhiều công ty đang tìm cách mở rộng mạng lưới phi tập trung.

Vì sao blockchain quan trọng với ngành lưu trữ dữ liệu

Cáp và đèn led trong một trung tâm máy chủ. Ảnh: Thomas Koehler/Photothek/Getty Images/Forbes Magazine

Thị trường lưu trữ đám mây được dự báo sẽ tăng quy mô lên 88,91 tỉ đô la Mỹ vào năm 2022, theo PR Newswire. Ngành lưu trữ dữ liệu phi tập trung đang nhanh chóng trở thành thị trường nóng với nhu cầu lớn và công nghệ blockchain sẽ đóng vai trò quan trọng vào sự thành công của thị trường này.

Đi sâu vào cách các công ty đang khai thác giải pháp này. Công nghệ lưu trữ dữ liệu phân tán được chia làm hai mảng: nền tảng thị trường và cơ sở hạ tầng.

Thị trường lưu trữ dữ liệu

Thị trường lưu trữ dữ liệu biến không gian ổ đĩa (disk space) trở thành một loại hàng hóa. Chúng đóng vai trò trung gian đứng giữa những người đang tìm kiếm nơi lưu trữ dữ liệu và các nhà cung cấp sẵn sàng lưu trữ dữ liệu. Các nền tảng tạo lập thị trường này hoạt động chủ yếu bằng cách chia sẻ tập tin trên một mạng ngang hàng (P2P), tương tự như Napster, website P2P đầu tiên cho phép người dùng chia sẻ nhạc miễn phí. Bạn sẽ phải mã hóa các tập tin và sau đó chúng được gửi đến các máy tính cá nhân trong mạng lưới này. Đằng sau đó, dữ liệu sẽ được chia thành các mảnh. Mỗi khi muốn lấy dữ liệu, bạn sẽ lấy tất cả các mảnh riêng lẻ từ các nút khác nhau trong mạng lưới và giải mã nó.

Bạn lưu trữ dữ liệu của mình ở đâu? Đây là thiết bị lưu trữ của Animoca ngay trong văn phòng. Ảnh: Polina Kazak (Worduuup)/Forbes Magazine

Những công ty như Storj, File Coin và Sia đều hoạt động như các nền tảng tạo lập thị trường. Họ hứa hẹn lưu trữ nhanh hơn, rẻ hơn và an toàn hơn các lựa chọn khác như DropBox, Amazon hay Google. Tuy nhiên, điều đó đòi hỏi phải trả một khoản phí để truy cập vào dữ liệu mà bạn lưu trữ, cho dù đó là một khoản phí hàng tháng từ các công ty tập trung hoặc phí giao dịch khi lấy dữ liệu của bạn ra khỏi các nút trong một mạng phân cấp. Do nhu cầu lưu trữ dữ liệu ngày càng tăng, nhu cầu về một giao thức lưu trữ dữ liệu chi phí thấp có quy mô đang rất cần thiết.

Một rủi ro trong các nền tảng này là phải đảm bảo được rằng, các nhà cung cấp dịch vụcam kết sẵn sàng lưu trữ dữ liệu của bạn vĩnh viễn. Nếu họ rời khỏi mạng lưới, bạn có thể sẽ mất dữ liệu. Khi đó, dữ liệu sẽ được lưu trữ ở bên ngoài mạng lưới.

Hạ tầng lưu trữ dữ liệu

Công nghệ blockchain được biết đến với đặc trưng giúp giải quyết các vấn đề liên quan tới lưu trữ dữ liệu. Những vấn đề này yêu cầu các giao thức bên thứ ba mới được tích hợp trên đầu các blockchain hiện có. Nhưng phí quá cao khiến việc lưu trữ dữ liệu trên chuỗi khó trở nên khả thi.

Một công ty đang nỗ lực giải quyết vấn đề này là Arweave và họ có cách tiếp cận khá mới mẻ trong việc lưu trữ dữ liệu trên chuỗi. Đó là một giao thức blockchain lưu trữ dữ liệu mới dựa trên tiêu chuẩn mới về cơ chế đồng thuận truy cập. Cơ chế đồng thuận này lần đầu tiên cho phép lưu trữ dữ liệu lâu dài thực sự. Giờ đây, dữ liệu cuối cùng cũng được lưu trữ vĩnh viễn, với chi phí thấp và kiểm duyệt miễn phí.

CEO Arweave, Sam Williams, cho biết: “Chúng tôi đang phát triển một công nghệ blockchain mới giống như hạ tầng, được gọi là blockweave. Đó là một nền tảng được thiết kế để cung cấp khả năng mở rộng việc lưu trữ trên chuỗi bằng một chi phí hiệu quả.” Arweave được xây dựng dựa trên bốn công nghệ lõi cho phép thực hiện 5.000 giao dịch mỗi giây (TPS).

Blockweave là một cấu trúc dữ liệu tương tự blockchain, cho phép lưu trữ dữ liệu trên chuỗi với chi phí thấp. Khi lượng dữ liệu lưu trữ trong mạng tăng lên, lượng thuật toán băm (hash) cần thiết để thực hiện cơ chế đồng thuận giảm xuống*. Điều đó giúp làm giảm chi phí lưu trữ dữ liệu. Do đó, người dùng của Arweave chỉ cần trả phí một lần để lưu trữ dữ liệu của họ mãi mãi.

Proof of Access (PoA) là một cơ chế đồng thuận mới. Các “thợ đào” sẽ cạnh tranh lẫn nhau để trở thành người lưu trữ lại nhiều dữ liệu nhất. Với số lượng dữ liệu được nhân rộng, điện năng được sử dụng trong quá trình “đào” sẽ giảm theo thời gian. “Thợ đào” càng cung cấp nhiều chỗ chứa trên Blockweave càng tốt.

Blockshadows cho phép lưu trữ dài hạn dữ liệu trên chuỗi. "Thợ đào" không phân phối toàn bộ khối (block). Họ phát một "bóng tối" có kích thước nhỏ, cho phép những nút khác trong mạng lưới tái tạo lại khối từ đầu. Vì chúng ta đang lưu trữ dữ liệu trên chuỗi, nên mạng lưới phải hỗ trợ các khối có kích thước không giới hạn. Chỉ những thông tin quan trọng của khối được di chuyển xung quanh mạng lưới so với toàn bộ khối.

Wildlife là một cơ chế khuyến khích và hệ thống tự tổ chức nhằm đánh giá uy tín của các thợ đào. Những "thợ đào" chậm và không có phản hồi sẽ có uy tín thấp. Ngược lại, việc lưu trữ dữ liệu nhanh chóng, được chia sẻ giữa các "thợ đào" trong mạng lưới sẽ mang đến cho bạn uy tín tốt.

Minh hoạ về cơ chế khuyến khích và hệ thống tự tổ chức đánh giá uy tín Wildlife. Các nút mạng tự xếp hạng các nút mạng khác dựa trên mức độ ưu tiên của các nút này với chúng trước đây. Ảnh: Arweare.org/Forbes Magazine

Chúng ta hiểu vì sao hạ tầng lưu trữ dữ liệu lại quan trọng đối với những kho lưu trữ dữ liệu chi phí thấp và có khả năng mở rộng quy mô. Bởi nó cung cấp nền tảng cho toàn bộ ngành lưu trữ dữ liệu phân tán. Bằng cách tạo ra lớp giao thức, Arweave có tiềm năng trở thành công ty dẫn đầu trong ngành cung cấp dịch vụ lưu trữ dữ liệu, bằng cách cung cấp ứng dụng phi tập trung với khả năng cho phép không kiểm duyệt và không thay đổi. Lưu trữ dữ liệu vĩnh viễn giờ đây đã thực sự xuất hiện.

(*): Blockweave là một ứng dụng blockchain mới về lưu trữ dữ liệu, không dựa trên bằng chứng xử lý (PoW), mà sử dụng không gian lưu trữ của ổ cứng để lưu trữ dữ liệu.

Tác giả Sherman Lee là partner tại Zeroth.AI, nơi tập trung đầu tư vào các công ty phát triển trí tuệ nhân tạo và công nghệ blockchain. Ông cũng là nhà sáng lập Raven Protocol, Rocco.AI và Good Audience.