微软发布更新版 DeepSpeed 库,能以更少 GPU 做到「兆级」AI 模型训练



微软(Microsoft)11 日发布更新版 DeepSpeed 库,此深度学习优化库引进新方法训练包含上兆参数的 AI 人工智慧模型,亦即模型内部可提供预测变量。微软宣称名为"3D 平行"(3D parallelism)的技术,可适应不同的工作负载需求,以便运行超大模型,同时平衡扩充效率。 

关于作者: 网站小编

码农网专注IT技术教程资源分享平台,学习资源下载网站,58码农网包含计算机技术、网站程序源码下载、编程技术论坛、互联网资源下载等产品服务,提供原创、优质、完整内容的专业码农交流分享平台。

热门文章