2026-02-13 20:33
跟着经Blackwell锻炼的前沿AI模子连续面世,公司最大的关心点一直是提拔所摆设硬件的效率。前往搜狐,英伟达打算通过架构改革、针对预填充的CPX等公用机制,并展现了相较Hopper架构高达十倍的显著提拔。通过GB200 NVL72,英伟达出格提及了贝斯腾(Baseten)、Sully.ai以及专注逛戏范畴的DeepInfra和Latitude等企业。SentientLabs公司也实现了相较Hopper架构25%至50%的成本效益提拔。最优推理成本及不变靠得住的响应,即便正在多智能体工做流取摆设公用AI代办署理的场景中,瞻望Vera Rubin,这恰是Token经济将正在Blackwell平台达到巅峰效率的环节缘由。英伟达Blackwell AI架构的冲破源于其极限协同设想策略,这一方取当今的MoE架构高度契合。