Intel Arc Pro B70 có thể ngốn 720W với 4 GPU khi chạy AI

Intel Arc Pro B70 đang cho thấy một hướng đi đáng chú ý ở phân khúc workstation AI giá vừa: ghép bốn card trong cùng hệ thống để đẩy khối lượng suy luận mà chưa cần bước sang hạ tầng máy chủ đắt đỏ. Theo dữ liệu từ một bài test độc lập, cấu hình 4 GPU này có thể chạm khoảng 720W khi chạy inference. Con số đó đủ lớn để biến điện năng, tản nhiệt và nguồn cấp thành phần thành bài toán bắt buộc phải tính ngay từ đầu. Với nhóm người dùng làm AI tại chỗ, khác biệt nằm ở chỗ chi phí giờ không chỉ là giá GPU, mà là toàn bộ phần cứng bao quanh nó.

720W nói lên điều gì về bài toán triển khai AI bằng workstation nhiều GPU?

Điểm đáng chú ý nhất không nằm ở riêng mốc 720W, mà ở cách mức tiêu thụ này hình thành. Bài test cho thấy mỗi Arc Pro B70 khi chạy inference thực tế chỉ lên khoảng 180W, thấp hơn đáng kể so với mức TDP tham chiếu 230W của bản reference. Khi nhân lên bốn card, tổng điện năng đi theo gần như tuyến tính, cho thấy tải được phân bổ khá đều thay vì có một GPU bị kéo quá sâu. Với người dựng workstation AI tại văn phòng hoặc phòng lab nhỏ, điều này quan trọng vì nó giúp dự đoán sát hơn yêu cầu nguồn, tản nhiệt và giới hạn của thùng máy.

720W nói gì về bài toán triển khai AI bằng workstation nhiều GPU?

Ở mặt triển khai, 720W cho riêng GPU cũng đồng nghĩa người dùng phải cộng thêm CPU, RAM, lưu trữ, quạt và phần hao hụt của bộ nguồn. Tổng mức điện thực tế của cả hệ thống vì vậy có thể cao hơn khá nhiều so với con số trên biểu đồ. Nếu chọn hướng nhiều GPU cho suy luận AI, người dùng phải tính trước dư địa nguồn, luồng gió và cả độ ồn khi tải kéo dài. Đổi lại, đây vẫn là lối đi hấp dẫn với nhóm muốn chạy model tại chỗ thay vì thuê hạ tầng ngoài, tương tự xu hướng tối ưu phần cứng AI mà AMD đang mở rộng trên Radeon, Instinct và Ryzen AI.

Arc Pro B70 hấp dẫn ở đâu ngoài điện năng, và ai nên quan tâm?

Về hiệu năng, Arc Pro B70 được ghi nhận nhanh hơn khoảng 30% đến 40% so với Arc Pro B50 trong Geekbench AI, đồng thời có bài test bám khá sát Radeon Pro W7900. Điều này khiến B70 đáng chú ý vì nó không chỉ là một card nhiều VRAM hơn, mà là lựa chọn có tỷ lệ hiệu năng trên điện năng đủ cạnh tranh trong một số bài suy luận. Khi gộp bốn card lại, giá trị thực tế nằm ở khả năng mở rộng khối lượng công việc mà không phải bước thẳng sang máy chủ AI chuyên biệt.

Thông số phần cứng cho thấy Intel đang nhắm khá rõ vào nhóm người dùng chuyên nghiệp: die BMG-G31, 32 Xe core, 32GB GDDR6 qua bus 256-bit và giao tiếp PCIe 5.0 x16 đầy đủ. 32GB VRAM trên mỗi card là điểm quan trọng vì nó quyết định trực tiếp loại mô hình và kích thước batch có thể chạy cục bộ. Nhiều bộ nhớ đồ họa hơn giúp giảm bớt cảnh phải cắt nhỏ bài toán hoặc đẩy dữ liệu qua lại liên tục, từ đó giữ thời gian phản hồi ổn định hơn. Đây cũng là hướng mở rộng đáng chú ý trong hệ sinh thái Arc, sau khi Intel trước đó đã liên tục làm dày câu chuyện GPU của mình bằng các cập nhật như Intel Precompiled Shaders trên GPU Arc.

Dĩ nhiên, Arc Pro B70 chưa thể coi là lời giải hoàn chỉnh cho mọi nhu cầu AI. Nguồn hàng được cho là chưa thực sự dồi dào, số lượng bài test độc lập còn ít và hiệu quả thực tế sẽ phụ thuộc vào phần mềm lẫn trình điều khiển. Nhưng trong bức tranh workstation AI giá vừa, dữ liệu hiện có cho thấy Intel đã chạm đúng điểm nóng của thị trường: người dùng muốn thêm năng lực suy luận mà vẫn giữ hệ thống trong tầm kiểm soát về chi phí. Và trong bài toán đó, mốc 720W không chỉ là số điện năng, mà là lời nhắc rằng AI cục bộ đang kéo cả bài toán hạ tầng xuống gần hơn với desktop và workstation.

Nguồn tham khảo: Wccftech

Viết một bình luận