英伟达与 Google Cloud 合作推出专注于 AI 的硬件实例

据国外媒体报道,当地时间2022年3月我五日 英伟达今天与 Google 合作推出了新的云硬件产品 L4平台,该平台经过优化以运行以视频为中心的应用程序。

英伟达表示,L4平台旨在加速“人工智能驱动”的视频性能,可通过谷歌的 G2虚拟机在谷歌云上进行私人预览。作为通用 GPU,L4提供视频解码以及转码和视频流功能。

除了通过谷歌云提供对 L4平台的访问外,谷歌还将 L4集成到其面向企业客户的托管机器学习服务 Vertex AI 中。

对于那些不想注册谷歌云的人来说,今年晚些时候英伟的网络硬件合作伙伴将提供 L4,包括华硕、思科、戴尔、惠普企业和联想。

英伟达与 Google Cloud 合作推出专注于 AI 的硬件实例

L4与 英伟达今天宣布的其他以人工智能为中心的硬件解决方案并驾齐驱,包括 L40、H100NVL 和用于推荐模型的 Grace Hopper。L40针对图形和支持 AI 的2D、视频和3D 图像生成进行了优化,而 H100NVL 支持部署 ChatGPT 等大型语言模型。(顾名思义,Grace Hopper for Recommendation Models 以推荐模型为中心。)

据悉,L40将于本周通过英伟达上述硬件合作伙伴发售。与此同时,英伟达预计Grace Hopper和H100NVL将在今年下半年发货。

相关新闻,今天标志着英伟达DGX云平台的发布,该平台使企业能够获得基础设施和软件,以训练生成式和其他形式的人工智能模型。今年早些时候宣布,DGX Cloud允许企业每月租用英伟达硬件集群从每月36,999美元开始。

DGX Cloud 的每个实例都具有八个 Nvidia H100或 A10080GB Tensor Core GPU,每个节点总共有640GB GPU 内存,并与存储配对。通过 DGX Cloud 订阅,客户还可以访问 AI Enterprise,这是 Nvidia 的软件层,包含 AI 框架、预训练模型和“加速”数据科学库。

英伟达表示,它正在与”领先的”云服务提供商合作,从甲骨文云基础设施开始,托管DGX云基础设施。微软Azure预计将在下个财季开始托管DGX Cloud,该服务将很快扩展到谷歌Cloud。

英伟达大举进军人工智能计算领域之际,该公司正在放弃在游戏和专业虚拟化等其他领域不盈利的投资。英伟达的最新财报显示,其数据中心业务(包括用于人工智能的芯片)持续增长(至36.2亿美元),这表明英伟达可能继续受益于人工智能的蓬勃发展。

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
有新私信 私信列表
搜索