深度解读英特尔数据中心 GPU Flex 系列:云游戏时代到来
英特尔今年推出了全新的数据中心 GPU Flex 系列,这一系列采用了与英特尔推出的锐炫桌面显卡同款的 Xe HPG 微架构,可很好的满足图像质量、部署密度和时延方面的要求,在媒体处理与传输、云游戏、AI 推理、VDI 等多种云工作负载下,有着出色的表现。
针对英特尔数据中心 GPU Flex 系列,英特尔公司市场营销集团副总裁、中国区云与行业解决方案部总经理梁雅莉表示:“科技创新和产业变革正带动数字经济蓬勃发展。放眼于日益增长的算力需求,英特尔基于 XPU 战略打造了跨 CPU、GPU、FPGA、IPU 等多种架构的算力资源。特别地,面向云计算,我们最新的英特尔 Flex 系列 GPU 采用了突破性设计,能够更有针对性地满足现阶段的相关计算需求,助力广泛生态伙伴创新。”
通过英特尔数据中心 GPU Flex 系列,原本不可能的云上业务需求成为真实可感的案例,比如云游戏、AI 推理等,下面我们通过这些案例来看看英特尔数据中心 GPU Flex 系列在这些全新的行业领域发挥的巨大价值。
英特尔数据中心 GPU Flex 系列介绍
英特尔数据中心 GPU Flex 系列面向行业伙伴提供 Flex 140 和 Flex 170 两个型号,包含多达 4 个 Xe 媒体引擎、 XMX AI 加速单元和 AV1 硬件编解码器,也是英特尔在数据中心领域首款支持 AV1 编解码的独立 GPU。
该系列 GPU 单卡能够支持多达 36 路视频流的 1080p60 转码吞吐量,以及 8 路视频流的 4K60 转码吞吐量,能够以低于同类型解决方案的能耗,提供更出色的媒体转码吞吐性能和解码吞吐性能。
此外,英特尔数据中心 GPU Flex 系列基于硬件的开源 AV1 编码器可节省 30% 以上的带宽。Flex 140 GPU 的媒体引擎还支持包括 HEVC、 AVC 和 VP9 在内的业界广泛使用的编解码器,并可以有效提高其性能。在软件层面,它可广泛支持主流媒体工具、API、框架和最新的编解码器。
具体配置上,Flex140 设计功耗为 75W,半高 PCIE 卡,内置 16 个 Xe 内核和 16 个光追单元;Flex170 设计功耗为 150W,全高 PCIE 卡,内置 32 个 Xe 内核和 32 个光追单元。
由于 Flex 系列 GPU 产品支持硬件 SR-IOV 技术,因此不需要额外购买虚拟化软件授权,对于行业合作伙伴来讲可以开箱即用。基于英特尔的开源软件工具 oneAPI,提供统一的编程架构,包括一整套开发者熟悉的编程语言和标准的跨架构库、工具和框架,使开发人员可以利用 oneAPI 支持的开放软件堆栈,轻松地开展面向 Flex 系列 GPU 的设计工作,充分释放硬件的性能潜力。并帮助用户开发开放的、易于移植的代码,更大限度利用多种跨英特尔硬件平台的组合,“用不同的架构处理不同类型的数据,真正做到‘用好的工具解决好的问题’”,并打破跨架构计算的平台壁垒。
性能表现方面,英特尔数据中心 GPU Flex 系列可以灵活处理多种云工作负载。在像素爆发的时代,媒体处理、传输和媒体编解码是非常常见的应用。Flex 系列也有强大的 AI 推理功能,尤其是与媒体处理结合,在图像的智能视觉推理上,可以带来非常大的性能提升。最后是 VDI,因为 Flex 系列 GPU 支持硬件 SR-IOV 技术,对提供 VDI 的厂商来说,可以优化使用者的总体拥有成本。
英特尔数据中心 GPU Flex 系列 AV1 编解码技术相比于 H.264 技术,在同样画质下可带来码率的大幅下降,从而降低数据的传输带宽,节省总体拥有成本。英特尔数据中心 GPU Flex 系列 140 在 AV1 解码吞吐量最高达到 218 路视频流,VP9 最高达到 228 路视频流。
目前主流的 H.265 转码性能 1080p60 帧下,英特尔数据中心 GPU Flex 系列 140 提供最高 36 路视频流路数转码,4K60 帧下提供 8 路视频流转码。整体功耗仅为 75W。
云游戏作为当下以及未来一段时间厂商重点关注的领域,英特尔数据中心 GPU Flex 系列 170 和 140 也得到很好的支持。
对于当下热门的游戏如王者荣耀,单张 Flex170 显卡在游戏画质为 720p30 时,可以同时支持多达 68 路的游戏同时运行 (视频中的图片为 60 路,随着优化的进行性能在不断提升)。这为游戏厂商带来极大成本的优化。除了 Android 游戏之外,在最近的版本发布上,英特尔数据中心 GPU Flex 系列也支持 Windows 云游戏,同一张卡既可以支持 Android 云游戏,又可以支持 Windows 云游戏,对于游戏厂商来说,英特尔数据中心 GPU Flex 系列这是一个非常灵活方案。
英特尔数据中心 GPU Flex 系列同样也支持 XeSS 超级采样技术。通过 AI 超分的技术手段,在画面质量接近的前提下,大幅缩短渲染时间,进而提升运行效率。在 4K 的渲染下,XeSS 超采样功能可大幅缩短渲染的时间。因此,对于很多标清转高清和修复老视频的应用,XeSS 超采样技术是可以带来大幅度的性能的提升。
在 AI 视觉推理上,往往需要多种场景结合使用,通过对视频流进行解码处理再进行 AI 运算,这是一个典型的多种工作负载融合的应用场景,需要 GPU 具有很好的灵活性。英特尔数据中心 GPU Flex 系列在媒体计算引擎和 Xe 矩阵扩展(XMX)加持下,Flex 170 在多种不同的编码格式和 AI 模型的组合中的性能测试表现,都超过了行业主流解决方案提供商。
通过这些数据,我们看到,英特尔数据中心 GPU Flex 系列能很好的帮助企业完成媒体处理与传输、云游戏和 AI 推理等复杂工作,由于配套的软件与硬件高度匹配,企业在拿到产品后开箱即用,同时较低的功耗和强大的性能表现,也大大节省了成本,因此,企业也从中受益匪浅。接下来,我们通过云游戏这个细分领域,来看看英特尔数据中心 GPU Flex 系列都带来了哪些变化。
助力云游戏加速,构建流畅高画质游戏体验
火山引擎是字节跳动旗下的云服务品牌,提供了云服务、AI、大数据等产品支持,通过字节跳动内部的发展和经验积累,汇总了诸多技术解决方案,为字节跳动旗下的视频内容分发、云游戏等服务提供高效方案。云游戏作为未来具有重要意义的游戏发展方向,火山引擎也为此形成了一套解决方案,云游戏目前最主流的解决方案是游戏所有计算和画面渲染在云端处理,然后将游戏图像转换为音视频数据传送给用户终端,从而大大降低游戏对手机硬件性能的需求。这也就很好的降低本地设备参与游戏的门槛。火山引擎为抖音云游戏打造的《航海王热血航线》,其背后最重要支持者英特尔也保障了游戏在云端的出色体验。
《航海王热血航线》这款游戏画质精美,同时包含大量精彩的格斗特效和对战要素,高画质下的流畅性是保证游戏体验的关键,进而对手机性能配置有较高的要求,低配手机游玩,可能会出现掉帧卡顿的情况。而通过云游戏这一解决方案,就能很好地解决设备配置不足的问题。
云游戏减轻了用户终端的性能需求,而服务器端的优化成了关键。这要求服务器、云端技术的建设者要以强有力的技术来保证体验。针对云游戏场景,火山引擎系统架构师梁宇向我们介绍了云游戏的具体应用,他说到:“目前我们的云游戏解决方案能够兼容多架构和多种 GPU 的硬件,同时支持安卓容器和安卓虚拟机。目前主要的落地场景集中在抖音云游戏和试玩广告上。”
谈到云游戏遇到的挑战,梁宇表示目前成本、硬件编码能力、端到端延迟是云游戏主要所面临的三大挑战。梁宇说:“挑战一是整个安卓实例单路的成本,具体分为两部分:一是包含 GPU 在内的硬件服务器成本,尤其是 GPU 的成本在整个服务器当中占了较大的比重;二是网络带宽的成本,为了应对降低网络带宽成本的需求,我们也开启了 H.265 的编码格式。在 H.265 编码格式开启之后,对于同样画质的码流,网络带宽的需求会下降。挑战二是在安卓云游戏的场景,对 GPU 的硬件编解码能力的需求较大。目前,在业界生态当中,GPU 编解码主要有两种类型,一种是额外增加外部的编码硬件,即特定的编码卡,另一种是 GPU 自带的编码器。而 Flex 140 自带的强大硬件编解码功能,十分有助于软硬件的整合和成本控制。挑战三是端到端延迟。我们在视频推流方面有自研的 ByteRTC,以及利用火山引擎的边缘节点部署来缩短端到端的网络延时。”
在整体架构运作上,客户端发起用户请求,传递到 PaaS 管理后台,在安卓容器的游戏服务节点里,激活云端的安卓设备,同时在云端的安卓设备当中运行起云端的游戏,把对应的音视频编解码图像,通过 RTC 服务器推送到用户端,同时用户端上面的用户任何操作,如触摸、点击,也可以通过 RTC 服务器传送到云端设备,做出相应响应。如何解决云游戏所面对的三大问题,这是云游戏行业所要面临的重大挑战。
在英特尔数据中心 GPU Flex 140 的加持下,《航海王热血航线》这款云游戏带来了巨大的性能提升,在这款游戏最大加载的极限情况下,720p60 帧场景,单张 Flex 140 的 GPU 编码达到 60 路,渲染为 20 路。在 1080p60 帧场景下,GPU 编码达到 28 路,渲染为 10 路。
总体而言,在 Flex 140 的场景下,渲染能力同样是 75 瓦的 GPU 是高于参考 GPU 的 12 路渲染,编码能力会更强大,最大可以支持 60 路的编码,高于参考 GPU 的 12 路编码。
英特尔数据中心 GPU Flex 系列为高密度、低延迟的安卓云游戏专门优化,在云游戏方面有着全链路的技术优势,出色的每瓦性能,超强的视频编码能力,支持加速的 AVC、HEVC、MPEG2、VP9 编码 / 解码和 AV1 解码,而且编解码速度快、时延低,甚至还能做到编码和渲染同步进行,因此效率极高。这让云游戏玩家能够获得高画质的视觉效果,同时成本更低。
总体来说,英特尔数据中心 GPU Flex 系列带来了一个高密度、低延迟、低功耗和低 TCO 的云游戏解决方案,也是《航海王热血航线》云游戏能够拥有优秀体验背后的灵魂。在软件方面,英特尔有 oneAPI 工具包,为开发者打造统一友好的编程环境,提高云游戏的性能和易用性。
英特尔数据中心 GPU Flex 系列满足了云游戏服务对性能、时延、成本、密度、稳定性等各个方面的需求,可以成为云游戏服务稳定良好运行的坚强后盾。
云游戏市场近些年随着 5G、GPU 虚拟化、边缘计算、AI 等技术的发展正以飞快的速度壮大。未来拥有广阔的市场,但总体来说,当前云游戏市场仍处于成本驱动的发展期,距离用户需求驱动的市场成熟还有一定长的路要走。而要引领产业走向成熟,也有一些问题需要解决,比如技术上原生云游戏引擎的发展、5G、GPU 虚拟化等技术的进化,游戏上云成本需要降低,包括硬件成本、带宽成本、运维成本,还有内容版权的规范等。
英特尔数据中心 GPU Flex 系列以及英特尔至强可扩展处理器,为云游戏产业往成熟方向发展注入了很大的动力。这样的产品对于整个云游戏产业生态不同环节凝聚力的提升,显然有重要的引领价值。
通过火山引擎与英特尔的合作,未来云游戏市场的蛋糕也将越做越大,更重要的在于玩家体验的升级、产业发展的良性、可持续。只有这样,行业才能逐渐从技术、产品驱动向用户需求驱动转化,整个云游戏的生态才能不断丰富,从而驶向更宽广的大海。
免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。