DeepSeek R2 bị hoãn ra mắt do gặp lỗi khi chuyển từ chip Nvidia sang Huawei

Tham vọng của Trung Quốc trong việc thúc đẩy sử dụng chip AI nội địa thay cho Nvidia đang đối mặt với nhiều thách thức. Mới đây, dự án phát triển mô hình ngôn ngữ lớn DeepSeek R2 đã bị trì hoãn sau khi nhóm nghiên cứu chuyển từ GPU của Nvidia sang nền tảng Ascend của Huawei – theo yêu cầu được cho là đến từ chính quyền Bắc Kinh.

Huawei chưa sẵn sàng thay thế Nvidia trong quá trình huấn luyện AI

Theo báo cáo từ Financial Times, ba nguồn tin thân cận xác nhận rằng DeepSeek đã buộc phải tạm ngưng dùng GPU Nvidia để chuyển sang phần cứng AI nội địa Huawei cho quá trình huấn luyện R2. Tuy nhiên, nền tảng của Huawei gặp phải nhiều vấn đề kỹ thuật: hiệu năng không ổn định, tốc độ kết nối giữa các thiết bị chậm và bộ công cụ phần mềm CANN của Huawei còn nhiều giới hạn.

Dù Huawei đã cử đội kỹ sư đến trung tâm dữ liệu của DeepSeek để hỗ trợ, quá trình huấn luyện trên nền tảng Ascend chưa bao giờ chạy thành công hoàn chỉnh. Cuối cùng, nhóm phát triển phải quay trở lại dùng GPU Nvidia để tiếp tục huấn luyện mô hình, trong khi vẫn cố gắng đảm bảo R2 có thể tương thích với chip Huawei trong giai đoạn suy luận (inference).

Deepseek R2 Bị Hoãn Ra Mắt Do Gặp Lỗi Khi Chuyển Từ Chip Nvidia Sang Huawei

Ban đầu, DeepSeek R2 dự kiến ra mắt vào tháng 5, nhưng đến nay vẫn chưa công bố chính thức. Theo cập nhật mới nhất, R2 có thể sẽ xuất hiện trong vài tuần tới, sau nhiều lần trì hoãn do sự cố phần cứng.

Chính trị và nguồn cung chip cao cấp ảnh hưởng đến chiến lược AI của Trung Quốc

Trước đó, DeepSeek từng tạo tiếng vang khi tuyên bố huấn luyện mô hình R1 trên 2.048 GPU Nvidia H800 với chi phí chỉ 5,5 triệu USD – thấp hơn rất nhiều so với các mô hình cạnh tranh. Tuy nhiên, sau đó có thông tin cho rằng họ thực chất đã tiếp cận được tới 50.000 GPU thuộc dòng Hopper, bao gồm 10.000 H800, 10.000 H100 và 30.000 HGX H20.

Việc chuyển hướng sang phần cứng nội địa không chỉ là thử nghiệm công nghệ, mà còn phản ánh chính sách kiểm soát công nghệ của Bắc Kinh. Trong bối cảnh nguồn cung GPU Nvidia cao cấp ngày càng hạn chế tại Trung Quốc, DeepSeek gần như không có nhiều lựa chọn. Mỹ gần đây đã đạt được thỏa thuận với Nvidia và AMD, trong đó các hãng này phải chia sẻ 15% doanh số chip AI tại Trung Quốc cho chính phủ Mỹ để được cấp phép bán hàng.

Tuy nhiên, truyền thông nhà nước Trung Quốc từng lên tiếng chỉ trích dòng H20 là không an toàn, lỗi thời và gây hại môi trường. Điều này buộc Nvidia phải tham dự các cuộc họp với cơ quan quản lý Trung Quốc để giải trình. Nvidia khẳng định rằng sản phẩm của họ không có cửa hậu (backdoor), không có công tắc khóa (kill switch) và không cài phần mềm gián điệp.

Với việc Trung Quốc đang gây áp lực lên nhiều công ty để tránh mua GPU H20 và phải giải trình lý do nếu vẫn muốn sử dụng chip ngoại, DeepSeek không phải là trường hợp cá biệt. Tuy nhiên, thực tế đã cho thấy chip nội địa vẫn còn khoảng cách rõ rệt so với Nvidia – đặc biệt là trong các mô hình AI thế hệ mới cần huấn luyện trên quy mô siêu lớn.

Viết một bình luận