跳到主要内容
博客计算比较视频处理单元 (VPU)、GPU 和 CPU

视频处理单元(VPU)、GPU 和 CPU 的比较

Blog_Header_1920x1008_

比以往任何时候都更多的用户通过互联网而不是广播电视订阅点播媒体流和参与直播流媒体视频。这种转变导致需要高度专业化的技术来支持性能关键型媒体转码和 OTT 流媒体功能。 

我们最近推出了加速计算Accelerated Compute),这是我们新的计算解决方案,可在云中访问特定应用集成电路(ASIC),首先是NETINT Quadra 视频处理单元(VPU)。VPU 是一种专用硬件,与GPU CPU 或GPU转码相比,它能更高效地对媒体进行编码和解码,功耗也大大降低。

在本博客中,您将了解到高级硬件设计概念,这些概念使 VPU 的性能与众所周知的 CPU 和GPU 不同。

关键媒体应用工作流程术语

  • 媒体编码:将音频、视频和图像流或文件从一种格式转换为另一种格式的过程,同时压缩原始文件以减小其大小并保持质量。
  • 媒体解码:将媒体文件或数据流转换为可播放格式的过程。
  • 媒体转码:将媒体转换为不同文件类型的综合过程(包括编码和解码),结合自定义功能,如降低分辨率、调整比特率或更改编解码标准,以支持不断变化的网络条件和播放环境。

硬件进步

随着技术的发展,对底层硬件造成特定应力的操作导致制造商使用新的材料组合,根据硬件的承受能力增加新的功能和性能层级。硬件创新、设计和生产的驱动力来自于优化硬件的电源以及用于单个电路和组件的原材料。

处理器单元设计和技术的进步一般由两个主要因素决定:

  • 在每个芯片上更密集地安装电路元件(或提高芯片物理空间的利用率)。
  • 扩展这些芯片上实现的微处理器的固有功能(或提升芯片本身作为开箱即用硬件的功能)。

建筑组件

下图说明了 CPU vs.GPU vs. VPU 中不同电路和引擎的数量和比例(概念层面)。GPU 在设计上密集安装了用于并行处理的算术逻辑单元或 ALU,这使得 GPU 在处理图形渲染和机器学习等工作负载时更加高效。相比之下,视频处理单元或 VPU 具有固定功能电路,可执行基于媒体的特定任务,如编码、解码、缩放以及视频编码和处理任务所需的其他功能。

  • 控制:同步(事件按指定顺序执行)数字电路,专门用于解释处理器指令和管理这些指令的执行。
  • 算术逻辑单元(ALU):组合(事件和逻辑 "按需 "应用)数字电路,响应数据输入以执行复杂逻辑。
  • 缓存:用于低延迟数据访问的本地缓存。
  • 固定功能视频处理:专用于以超高效率和低功耗执行特定预定任务的电路。
  • 人工智能引擎:专门用于人工智能(AI)任务的计算模块,可最大限度地进行矩阵和矢量处理。

为何重要

除了纯粹的处理能力外,转码工作负载还需要专门的硬件来实现最高效率。根据测试期间的客户反馈,用户发现Dedicated CPU 计划最多只能实现 2-4 个并发流,而在 VPU 驱动的加速实例上可实现 30 个并发流。除了节省总体成本外,更高的密度还能让媒体机构和技术合作伙伴降低每个流的成本。

在云中访问 VPU 还意味着您可以根据需要调整大小,或在应用程序扩展时或高峰期增加只有 VPU 才能提供的专用处理能力。

创建账户开始使用Akamai云加速实例,或联系我们的云计算顾问了解更多信息。

注释

留下回复

您的电子邮件地址将不会被公布。 必须填写的字段被标记为*