Thị trường chip Trí tuệ nhân tạo (AI) đang là cuộc đua khốc liệt, nơi Intel đang tìm kiếm một hướng đi mới để cạnh tranh với gã khổng lồ NVIDIA. Theo thông tin mới nhất, Intel đã tìm thấy một “pha cứu cánh” đầy bất ngờ cho dòng chip AI của mình bằng cách hợp tác với chính đối thủ. Cụ thể, giải pháp Gaudi 3 rack-scale của Intel được cho là đã tích hợp với công nghệ Blackwell của NVIDIA. Sự kết hợp độc đáo này nhằm tận dụng chip AI của Intel cùng với Blackwell để mang lại những nâng cấp hiệu suất ấn tượng, hứa hẹn một nền tảng AI lai (Hybrid AI platform) hiệu quả cho khách hàng doanh nghiệp.
Intel Gaudi 3 và GPU Blackwell B200: chiến lược “nếu không thắng thì hợp tác”
Chúng ta đều biết rằng chip AI của Intel, đặc biệt là dòng Gaudi, đang gặp khó khăn trong việc tăng doanh thu so với các đối thủ lớn như NVIDIA và AMD trên thị trường AI. Giờ đây, Intel dường như đã tìm ra một cách độc đáo để thúc đẩy doanh số nền tảng Gaudi của mình. Theo chuyên trang SemiAnalysis, Intel có kế hoạch cung cấp cho khách hàng một hệ thống Gaudi 3 rack-scale mới, sẽ có cấu hình lai đặc biệt, tích hợp cả GPU Blackwell B200 của NVIDIA cùng với công nghệ mạng Connect-X.
Đây được xem là một trong những thông báo đáng chú ý tại sự kiện OCP Global Summit, nơi Đội Xanh (Team Blue) lên kế hoạch tận dụng phân khúc AI rack-scale một cách khác biệt. Về cách thức hoạt động, đây là một sự triển khai độc đáo: chip AI Gaudi 3 của Intel sẽ đảm nhận phần ‘decode’ (giải mã) của khối lượng công việc suy luận (inferencing workloads), trong khi B200 sẽ chịu trách nhiệm cho các giai đoạn ‘prefill’ (điền trước) đòi hỏi tính toán mạnh mẽ hơn.
Các GPU Blackwell vốn được biết đến là có hiệu suất tốt nhất trong các tác vụ nhân ma trận lớn (large matrix-multiply bursts) trên toàn bộ ngữ cảnh, nhờ vào đặc tính hiệu suất cao của nền tảng này. Vì vậy, việc giao cho Blackwell xử lý các tác vụ prefill là một động thái hợp lý, tối ưu hóa sức mạnh của cả hai loại chip.
Cấu trúc mạng và hiệu suất: ưu thế của hệ thống AI rack-scale kết hợp
Trong thiết lập lai này, chip Gaudi 3 của Intel sẽ tập trung nhiều hơn vào băng thông bộ nhớ và khả năng mở rộng Ethernet-centric trong sự kết hợp ở cấp độ rack-scale (quy mô tủ máy chủ). Đây là lý do khiến sự sắp xếp này trở nên hợp lý và có tiềm năng.
Về mặt kết nối mạng, toàn bộ rack sử dụng các bộ điều hợp mạng NVIDIA ConnectX-7 400 GbE NICs trên các khay tính toán (compute trays) và switch Broadcom Tomahawk 5 51.2 Tb/s ở cấp độ rack, nhằm đảm bảo khả năng kết nối toàn diện (all-to-all connectivity). SemiAnalysis cho biết, mỗi khay tính toán (compute tray) được trang bị hai CPU Xeon, bốn chip AI Gaudi 3, và bốn NICs, cùng với 1x NVIDIA BlueField-3 DPU. Toàn bộ hệ thống có tổng cộng mười sáu khay trên mỗi rack.
Nền tảng Gaudi tự định vị mình là một công cụ giải mã tiết kiệm chi phí trong một hệ sinh thái đang bị NVIDIA thống trị. Do đó, cách tiếp cận ở đây có thể được tóm gọn là “nếu bạn không thể đánh bại họ, hãy gia nhập họ”.
Phương pháp này không chỉ mang lại lợi ích cho Intel mà còn được chứng minh bằng hiệu suất. Theo tuyên bố, thiết lập rack-scale lai này đạt được hiệu suất prefill nhanh hơn 1,7 lần so với việc chỉ sử dụng nền tảng B200 trong các mô hình nhỏ và dày đặc (small, dense models). Tuy nhiên, cần lưu ý rằng tuyên bố về hiệu suất này chưa được kiểm nghiệm độc lập.
Tiềm năng thương mại hóa và rào cản phần mềm của Gaudi AI
Cách tiếp cận này giúp Intel có thể kiếm tiền từ nền tảng Gaudi bằng cách đóng gói nó thành một hệ thống rack-scale hoàn chỉnh, thay vì bán chip đơn lẻ. Đối với NVIDIA, điều này cũng ngầm xác nhận rằng khả năng kết nối mạng của họ đang đứng đầu thị trường.
Mặc dù thiết lập lai này nghe có vẻ đầy hứa hẹn, nền tảng Gaudi AI vẫn phải đối mặt với một rào cản lớn: bộ phần mềm chưa trưởng thành (immature software stack). Vấn đề này có thể sẽ hạn chế mức độ chấp nhận và áp dụng rộng rãi của nó trong ngành công nghiệp.
Bên cạnh đó, do kiến trúc Gaudi được thiết lập để dần loại bỏ trong vài tháng tới, giới phân tích nghi ngờ rằng cấu hình rack-scale lai này sẽ đạt được mức độ phổ biến đại trà tương tự như các giải pháp thay thế khác trên thị trường. Dù vậy, đây vẫn là một nỗ lực đáng ghi nhận của Intel trong việc tìm kiếm một vị thế vững chắc trong lĩnh vực AI đầy cạnh tranh này.