H100推理性能最高提升8倍,英伟达发布TensorRT-LLM模型
IT之家 9 月 9 日消息,英伟达今天宣布推出名为 TensorRT-LLM,是一个深度优化的开源库,能够在 Hopper 等 AI GPU 上加速所有大语音模型的推理性能。
英伟达目前已经和开源社区合作,利用 SmoothQuant、FlashAttention 和 fMHA 等尖端技术,实现 AI 内核来优化其 GPU,可以加速 GPT-3(175 B),Llama Falcom(180 B)和 Bloom 模型。
TensorRT-LLM 的亮点在于引入了名为 In-Flight batching 的调度方案,允许工作独立于其他任务进入和退出 GPU。
该方案允许同一 GPU 在处理大型计算密集型请求时,动态处理多个较小的查询,提高 GPU 的处理性能,可以让 H100 的吞吐量加快 2 倍。
在性能测试中,英伟达以 A100 为基础,对比了 H100 以及启用 TensorRT-LLM 的 H100,在 GPT-J 6B 推理中,H100 推理性能比 A100 提升 4 倍,而启用 TensorRT-LLM 的 H100 性能是 A100 的 8 倍。
在 Llama 2 中,H100 推理性能是 A100 的 2.6 倍;而启用 TensorRT-LLM 的 H100 性能是 A100 的 4.6 倍。
IT之家在此附上报告原文,感兴趣的用户可以深入阅读。
- 维修知识
- 安装知识
- 清洗保养
- 行业新闻
- 常见问题
- Baixue风幕柜售后24小时人工客服02-27
- 广州比斯汀冰箱售后电话是多少02-27
- Giggas集成灶24小时服务热线02-27
- 古罗尼消毒柜售后服务热线02-27
- 佛山V-ZUG冰箱售后维修是多少02-27
- 内芙热水器售后服务号码02-27
- 中燃宝热水器售后电话02-27
- Olodo洗碗机售后服务热线02-27
- MENFISIT地暖售后24小时人工客服02-27
- MICOE锅炉售后维修02-27
- WOLL集成灶售后24小时人工客服02-27
- GEAppliances热水器售后维修02-27
- 广州斯力威尔酒柜售后维修是多少02-27
- 富士通将军空调维修电话02-27
- 广州海斯曼制冰机售后服务热线是多少02-27
- 喜莱盛酒柜维修电话02-27
- 巴洛特地暖售后服务号码02-27
- 广州VINOPRO酒柜售后服务热线是多少02-27
- 孚欧燃气灶售后服务号码02-27
- 广州东芝空气源热泵售后维修是多少02-27
- KADISHI风幕柜维修电话02-27
- 佛山KOLLER制冰机售后服务号码是多少02-27
- FULGOR燃气灶售后维修电话是多少02-27
- 德国库恩壁挂炉售后服务热线02-27
- 佛山格瑞特展示柜售后服务号码是多少02-27
- 佛山奇声冰箱售后服务热线是多少02-27
- 佛山嘉旺佰特制冰机售后服务热线是多少02-27
- 广州Baxi空气能维修电话是多少02-27
- 广州欧品冰箱售后电话是多少02-27
- 三洋空气源热泵售后电话24小时人工电话02-27
- Sub-Zero冰箱售后服务号码02-27
- 广州SHARP空气能售后服务号码是多少02-27
- DIBONA锅炉24小时人工服务热线02-27
- 千石保险柜400客服电话02-27
- 德姆勒冰箱售后24小时人工客服02-27
- 巴洛迪锅炉400客服电话02-27
- Fardior烤箱售后维修02-27
- 凯奇史密斯集成灶售后服务号码02-27
- 发罗力地暖售后电话02-27
- LNGLKA地暖维修电话02-27
- gorenje酒柜售后24小时人工客服02-27
- Pattex空气能售后维修02-27
- 博仑博各燃气灶维修电话02-27
- HCK酒柜售后电话02-27

