每秒110万个token!微软MSFT.US和英伟达NVDA.US联手刷
- 栏目:资讯
- 来源:证券之星
- 发布时间:2026-02-12 15:55
- 阅读量:6295
联手刷新AI推理纪录)
智通财经APP获悉,微软宣布,其Azure ND GB300v6虚拟机在Meta的Llama270B模型上实现了每秒推理速度达110万token的行业新纪录。据悉,Azure ND GB300虚拟机采用英伟达(NVDA.US)的Blackwell Ultra GPU,具体为NVIDIA GB300NVL72系统,配置72个NVIDIA Blackwell Ultra GPU和36个NVIDIA Grace CPU,采用单机架构设计。这款虚拟机专为推理工作负载优化,具有50%的GPU内存提升和16%的热设计功率(TDP)提高。
微软首席执行官萨提亚?纳德拉在社交媒体上表示:“这一成就是我们与英伟达长期合作和在生产规模运行人工智能方面专业知识的结晶。”
资料显示,为了验证性能提升,微软在一个NVIDIA GB300NVL72域下的18台ND GB300v6虚拟机上运行了Llama270B模型,使用NVIDIA TensorRT-LLM作为推理引擎。微软表示:“一个NVL72机架的Azure ND GB300v6实现了总计110万个token/秒的推理速度。” 这一新记录超越了微软之前在NVIDIA GB200NVL72机架上实现的86.5万个token/秒的成绩。
对此,Signal65的实验室副总裁拉斯?费洛斯指出:“这一里程碑不仅突破了每秒百万token的障碍,还在一个能够满足现代企业动态使用和数据治理需求的平台上实现。” 他补充称,Azure ND GB300相较于上一代NVIDIA GB200在推理性能上提升了27%,而仅增加了17%的功率规格。
免责声明:该文章系本站转载,旨在为读者提供更多信息资讯。所涉内容不构成投资、消费建议,仅供读者参考。
猜你喜欢
- CoveredbyMedicalInsurance!2026-02-12 13:51
- 淮安市淮阴区:“人才房票”助力人才安居2026-02-12 11:44
- 美股异动Q3财报多项核心指标超预期SpotifyTe2026-02-12 05:06
- 实地探访黄金消费市场:品牌首饰金价再创新高普遍突破12026-02-11 16:05
- AI医疗领域重磅政策助推行业加速变革2026-02-11 13:53
- 浙数文化参投基金进展:完成首期付款720万元并收到备2026-02-11 11:40
- 标普全球10月香港PMI升至51.2连续3个月处于扩2026-02-11 09:36
- 百得胜家居张健:服务好消费者是企业生存的根本2026-02-11 07:11
- 澳大利亚酿酒师赴宁夏“论酒”共探葡萄酒产业新机遇2026-02-11 02:26
- 广西龙州奶水牛产业托起农户致富梦2026-02-10 16:02





