Nvidia Vera Rubin - Superchip AI 100 PetaFLOPS và 88 nhân Arm

Trong bối cảnh cơn sốt Trí tuệ Nhân tạo (AI) bùng nổ, Nvidia đã chuyển mình hoàn toàn từ một công ty chuyên về card đồ họa chơi game thành người dẫn đầu trong lĩnh vực phần cứng AI, với giá trị thị trường đạt gần 5 nghìn tỷ USD. Giờ đây, công ty lại tiếp tục gây choáng váng khi ra mắt nền tảng AI thế hệ tiếp theo: Vera Rubin “Superchip”. Đây là một bộ não siêu việt, được thiết kế đặc biệt để xử lý các công việc AI tạo sinh (như ChatGPT, tạo video) với cường độ cao nhất. Đây là một con chip được ví như một “siêu máy tính thu nhỏ” chuyên biệt dành cho các trung tâm dữ liệu.

Phần cứng mới này vừa được CEO Jensen Huang (người sáng lập Nvidia, nổi tiếng với chiếc áo khoác da) công bố tại Hội nghị Công nghệ GPU (GTC) của Nvidia ở Washington. Nền tảng Vera Rubin cực kỳ mạnh mẽ, sở hữu một CPU “Vera” duy nhất với 88 nhân Arm được tùy chỉnh, cùng với hai GPU “Rubin” kết hợp lại. Sức mạnh tính toán mà nó mang lại đạt tới 100 petaFLOPS (tương đương 100 triệu tỷ phép tính mỗi giây) ở định dạng FP4 – một con số khổng lồ dành cho các tác vụ AI phức tạp.

Table of Contents

“Superchip” làm mát bằng chất lỏng mạnh gấp 100 lần thế hệ cũ

Vera Rubin là hệ thống máy tính quy mô rack thế hệ thứ ba của Nvidia, tiếp nối các đời GB200 và GB300 trước đó. Điểm đặc biệt của nó là hệ thống này được làm mát bằng chất lỏng, chứa sáu nghìn tỷ bóng bán dẫn (transistor) – các công tắc điện siêu nhỏ – và tích hợp 2 TB (2.000 GB) bộ nhớ truy cập cực nhanh. Nói một cách dễ hình dung, cấu hình cơ bản của Vera Rubin mang lại sức mạnh tính toán thô cao gấp khoảng 100 lần so với DGX-1, nền tảng học sâu đầu tiên của Nvidia ra mắt chỉ vài năm trước.

Vera Rubin sẽ được bán ra thị trường với nhiều cấu hình khác nhau để đáp ứng mọi nhu cầu. Chẳng hạn, phiên bản NVL144 được trang bị hai GPU, mang lại hiệu suất suy luận (dùng AI để tạo ra kết quả) cực nhanh. Phiên bản nâng cấp mạnh mẽ nhất là NVL144 CPX được đánh giá có hiệu suất cao hơn gấp 7.5 lần so với các hệ thống GB300 hiện tại của Nvidia.

Đối với các trung tâm dữ liệu siêu lớn (hay còn gọi là hyperscale data centers) cần sức mạnh xử lý vượt trội hơn nữa cho các mô hình AI khổng lồ, Nvidia sẽ cung cấp các hệ thống Rubin Ultra NVL576 được tùy chỉnh. Hệ thống này được cấu hình với bốn GPU lớn và bộ nhớ tốc độ cao lên tới 365 TB, mang lại hiệu suất suy luận cực kỳ ấn tượng. Mức tăng trưởng hiệu suất này cao gấp 8 lần so với thế hệ GB300 trước đó, khẳng định vị thế dẫn đầu tuyệt đối của Nvidia.

Cấu trúc GPU Rubin và thời gian chip ra mắt thị trường

Về mặt cấu tạo, mỗi GPU Rubin là một kiệt tác công nghệ. Nó bao gồm hai chiplet (các chip nhỏ hơn ghép lại) dùng để tính toán và tám chồng bộ nhớ băng thông cao HBM4 (loại bộ nhớ nhanh nhất hiện nay). Bo mạch chủ của nó cũng bao gồm năm đầu nối NVLink đặc biệt để giao tiếp. Các đầu nối này được thiết kế để liên kết các GPU với bộ chuyển mạch NVLink – một “đường cao tốc” dữ liệu riêng của Nvidia – trong khi các đầu nối khác lo liệu về nguồn điện và kết nối dữ liệu tiêu chuẩn.

CEO Huang kỳ vọng rằng GPU Rubin sẽ bắt đầu đi vào sản xuất hàng loạt vào nửa cuối năm 2026. Các hệ thống hoàn chỉnh như NVL144 dự kiến sẽ ra mắt vào cuối năm đó hoặc đầu năm 2027. Các hệ thống siêu mạnh NVL576 sẽ có mặt muộn hơn, có khả năng là vào nửa cuối năm 2027.

Việc công bố nền tảng Vera Rubin là một tín hiệu rõ ràng về cuộc đua không ngừng nghỉ trong ngành AI. Nó không chỉ là một con chip mà là một hệ sinh thái được thiết kế để cung cấp cơ sở hạ tầng thiết yếu cho các mô hình AI phức tạp trong tương lai. Với sự kết hợp giữa hiệu suất thô kỷ lục, hiệu quả năng lượng cao và hệ thống làm mát bằng chất lỏng tiên tiến, Vera Rubin đang định hình tiêu chuẩn mới cho trung tâm dữ liệu AI trên toàn cầu.

Nvidia Vera Rubin – Superchip AI 100 PetaFLOPS và 88 nhân Arm

“Superchip” làm mát bằng chất lỏng mạnh gấp 100 lần thế hệ cũ

Cấu trúc GPU Rubin và thời gian chip ra mắt thị trường

Viết một bình luận Hủy