Tenstorrent Blackhole gây sức ép lên Nvidia GB300: 350 token/giây có ý nghĩa gì?
Tenstorrent Blackhole được công bố đạt 350 token/giây với DeepSeek R1 và TCO thấp hơn Nvidia GB300. Vì sao thị trường AI server phải chú ý?
Tenstorrent Blackhole được công bố đạt 350 token/giây với DeepSeek R1 và TCO thấp hơn Nvidia GB300. Vì sao thị trường AI server phải chú ý?
NVIDIA dừng các Jetson đời cũ dùng LPDDR4 khi giá RAM tăng và nguồn cung căng, buộc hệ AI edge, robot và nhúng công nghiệp tính lại lộ trình nâng cấp.
ASUS ROG Astral RTX 5090 vừa trở thành tâm điểm của giới ép xung khi được đẩy lên mốc 3,7 GHz, bộ nhớ 36 Gbps và vượt 50.000 điểm trong 3DMark Port Royal. Trên giấy tờ, đây là những con số rất dễ gây choáng vì chúng cho thấy Blackwell …
Intel 18A-P được đồn đoán hút Apple cho chip M mới, còn EMIB có thể vào Google TPUv8e. Vì sao tín hiệu này quan trọng với cuộc đua chip AI?
NVIDIA Nemotron 3 Nano Omni hợp nhất audio, video, ảnh và văn bản trong một mô hình mở, hứa hẹn tăng thông lượng agent AI gấp 9 lần và giảm chi phí triển khai cho doanh nghiệp.
NVIDIA Rubin Google đưa Vera Rubin vào hạ tầng A5X của Google với tham vọng mở rộng tới gần một triệu GPU. Điều này tác động gì tới cuộc đua AI cloud?
NVIDIA hỗ trợ DeepSeek V4 trên Blackwell ngay ngày đầu, đạt 3.500 token/giây với mô hình 1.6T. Bước đi này tác động gì tới cuộc đua AI inference?
NEO 3D X-DRAM cho chip AI đã qua proof-of-concept với test chip dưới 10 ns và quy trình dựa trên 3D NAND. Nhưng từ phòng lab tới đối trọng HBM vẫn còn quãng dài.
Meta đưa hàng chục triệu lõi AWS Graviton vào hạ tầng AI, cho thấy agentic AI đang khiến CPU trở lại vai trò lớn bên cạnh GPU, từ chi phí đến vận hành.
TeraFab Intel 14A cho thấy tham vọng tự làm chip AI của Musk đang đi xa hơn: Tesla lo dây chuyền thử nghiệm, còn SpaceX nhắm tới sản xuất số lượng lớn.