NVIDIA Rubin Ultra chuyển sang Dual-Die, giữ nguyên thông số

Rubin Ultra từng được xem là cú nhảy lớn nhất trong roadmap AI của NVIDIA, vì bản vẽ ban đầu gom 4 die GPU cỡ reticle vào cùng một package. Báo cáo từ truyền thông Đài Loan cho biết NVIDIA nay đã đổi Rubin Ultra sang cấu hình Dual-Die 2+2, tức mỗi Kyber blade vẫn có 4 die nhưng chia thành hai cặp. Điều đáng chú ý là Rubin Ultra không bị cắt sức mạnh tính toán, khi 16 stack HBM4 và tổng 1TB bộ nhớ được cho là vẫn giữ nguyên. Với thị trường AI, thay đổi này quan trọng vì nó cho thấy NVIDIA đang ưu tiên khả năng sản xuất ổn định hơn là theo đuổi một cấu trúc quá phức tạp.

Rubin Ultra đổi cách ghép die để tránh nút thắt đóng gói

Thiết kế Rubin Ultra đầu tiên được mô tả như một cấu trúc rất tham vọng: 4 die GPU, 16 stack HBM4, 1TB bộ nhớ và CoWoS-L packaging gói tất cả vào cùng một package. Đây là kiểu kiến trúc có mật độ cực cao, nên chỉ cần sai số nhỏ về nhiệt hoặc cơ học là yield có thể giảm rõ rệt. Nếu nhìn sang cách NVIDIA điều chỉnh roadmap trong Rubin CPX, có thể thấy hãng sẵn sàng sửa thiết kế khi bài toán triển khai thực tế đòi hỏi. Với Rubin Ultra, khác biệt lớn nhất không nằm ở số die cuối cùng mà ở cách ghép 4 die đó để chuỗi cung ứng còn theo kịp.

Hạng mục Thiết kế ban đầu Thiết kế mới
Cách ghép die 4 die trong 1 package 2+2, chia thành 2 cặp trên board
Đóng gói CoWoS-L cho 4 die cùng lúc Giảm rủi ro warping
Bộ nhớ 16 stack HBM4, 1TB Giữ nguyên 16 stack HBM4, 1TB
Mục tiêu Tối đa mật độ Dễ sản xuất hơn

Rubin Ultra đổi cách ghép die để tránh nút thắt đóng gói

Cách bố trí 2+2 này có nghĩa mỗi Kyber blade vẫn mang đủ 4 die của Rubin Ultra, nhưng áp lực nhiệt và cơ học không còn dồn hết lên một package duy nhất. Nói dễ hiểu, NVIDIA chấp nhận đi thêm một bước ở mức board-level assembly để đổi lấy biên an toàn tốt hơn cho sản xuất hàng loạt. Theo mô tả chính thức về nền tảng NVIDIA Vera Rubin, Rubin vẫn là trụ cột cho các hệ thống AI rack-scale từ nửa sau năm 2026, nên một thiết kế dễ đóng gói hơn gần như là điều bắt buộc nếu hãng muốn giao hàng đúng nhịp. Rubin Ultra vì thế đang chuyển từ kiểu trình diễn kỹ thuật sang kiểu kiến trúc có thể sản xuất thật với sản lượng lớn.

Hiệu năng Rubin Ultra có đổi không, và điều này nói gì về chuỗi cung ứng?

Theo phần thông tin đang được lan truyền, Rubin Ultra không bị hạ thông số compute sau khi đổi sang cấu trúc Dual-Die, và đây là chi tiết đáng chú ý nhất. Nếu đúng như vậy, NVIDIA đã tìm được cách giữ nguyên 16 stack HBM4 và 1TB bộ nhớ nhưng tách rủi ro sản xuất sang một bố cục dễ thở hơn. Với thị trường AI, đó là khác biệt lớn, vì khách hàng hyperscaler quan tâm không chỉ hiệu năng đỉnh mà còn là khả năng giao số lượng lớn và ít lỗi đóng gói. Bài toán bộ nhớ cũng không nhỏ, bởi khi một blade vẫn cần HBM4 dung lượng cực cao, áp lực lên supply chain vẫn rất lớn như những gì thị trường đang thấy ở các giải pháp mới như stacked GDDR kiểu HBM.

Từ góc nhìn thị trường, thay đổi này rất thực dụng: ít rủi ro warping hơn, ít phụ thuộc vào một cấu hình đóng gói quá khó và dễ cho đối tác trong chuỗi cung ứng thích nghi hơn khi sản lượng tăng. Cũng cần nói rõ rằng đây mới là báo cáo từ truyền thông Đài Loan được Wccftech dẫn lại ngày 1/4/2026, nên NVIDIA chưa trực tiếp xác nhận từng chi tiết của bản sửa đổi này. Dù vậy, hướng đi 2+2 hợp logic kỹ thuật hơn nhiều so với phương án dồn 4 die cỡ reticle vào một package rồi kỳ vọng mọi thứ chạy mượt ở quy mô lớn. Nếu mốc thương mại của Rubin Ultra trong giai đoạn cuối 2026 đến 2027 vẫn được giữ, quyết định thay đổi sớm ở tháng 4/2026 có thể giúp NVIDIA tránh một nút thắt sản xuất quan trọng.

Viết một bình luận