Digg từ bỏ MySQL, chuyển sang dùng NoSQL

Trang bầu chọn nội dung lớn nhất trên Internet Digg.com đang trong quá trình thay đổi toàn bộ hạ tầng phần mềm nhằm tăng tốc ứng dụng cũng như mở rộng mạng lưới. Một trong những nội dung quan trọng nhất đó là nỗ lực thay thế gần như toàn bộ cơ sở dữ liệu nguồn mở nổi tiếng nhất mà họ đã sử dụng từ ngày thành lập cho đến nay, MySQL.

Cassandra logo

Thay cho MySQL - một cơ sở dữ liệu quan hệ, vốn là loại cơ sở dữ liệu phổ biến nhất - là Cassandra, một loại cơ sở dữ liệu không phải là quan hệ (được gọi chung là các cơ sở dữ liệu NoSQL). Cassandra vốn là 1 sản phẩm nguồn mở của Facebook, nay nằm dưới sự điều hành của Apache Software Foundation.

Theo các lập trình viên của dự án Cassandra, cơ sở dữ liệu này hiện đang được dùng bởi Rackspace, Facebook, Twitter. Và nay danh sách này có thêm Digg.

John Quinn, phó chủ tịch phụ trách kỹ thuật tại Digg cho biết họ đã phát triển một công cụ giúp cho việc chuyển đổi từ MySQL sang Cassandra được dễ dàng và nhanh chóng hơn (với sự trợ giúp của Hadoop -- cũng là một dự án của Apache Software Foundation về ứng dụng phân tán). Công cụ này sẽ được mở nguồn trong thời gian tới nhằm hỗ trợ những cá nhân hay tổ chức có ý định chuyển đổi tương tự.

Giải thích về nguyên nhân thay thế MySQL, Quinn cho biết Cassandra là một mô hình cơ sở dữ liệu phân tán hoàn toàn, có khả năng chịu lỗi cực tốt. Một tính chất nữa là nó rất linh hoạt, tốc độ đọc/ghi tăng tuyến tính khi bổ sung thêm hạ tầng mới. Những đặc điểm này của một hệ cơ sở dữ liệu không quan hệ là thích hợp hơn với các ứng dụng phân tán lớn như Digg hơn là các cơ sở dữ liệu quan hệ truyền thống.

Mặc dù hầu hết hạ tầng phần mềm của Digg sẽ dùng Cassandra, MySQL vẫn được dùng trong một số trường hợp đặc biệt như một vài ứng dụng cụ thể hay khi cần triển khai mô hình ứng dụng nhanh chóng. "MySQL có mức độ mềm dẻo mà Cassandra không thể có. Nó rất thích hợp với các dự án nhỏ", Quinn cho biết.