您的位置 首页 电子技术

基于软件的Vitis AI 2.0加速解决方案

Vitis AI 2.0 全面发布!作为赛灵思 FPGA 和自适应 SoC 上最综合全面的基于软件的 AI 加速解决方案,Vitis AI 继续为用户的 AI 产品贡献价值与竞争力。2.0 版本的 Vitis AI 解决方案更易于开发者使用,给边缘和数据中心带来进一步的性能提升。本篇文章将会介绍新产品特性,具体包括模型、软件工具、深度学习处理单元以及最新的性能信息。\” />

<meta http-equiv=X-UA-Compatible content=\"IE=edge,chrome=1

Vitis AI 2.0 来了!

Vitis AI 2.0 全面发布!作为赛灵思 FPGA 和自适应 SoC 上最综合全面的基于软件的 AI 加速解决方案,Vitis AI 继续为用户的 AI 产品贡献价值与竞争力。2.0 版本的 Vitis AI 解决方案更易于开发者使用,给边缘和数据中心带来进一步的性能提升。本篇文章将会介绍新产品特性,具体包括模型、软件工具深度学习处理单元以及最新的性能信息。

Vitis AI 2.0 版本的主要特性:

1

通过更好的CPU OP流程显著提升了模型覆盖率,同时支持了Tensorflow框架内推理机制;

2

新增20个先进的 AI 模型,用于 CNN 和 NLP 中的传感器融合、视频分析、超分辨率和情感估计应用;

3

在 VCK190和 VCK5000硬件平台上提供了灵活的DPU IP配置及新功能,包括支持 3D 卷积、depthwise卷积等,可满足更多需求。

1

易用性取得突破性进展

用户自定义OP :

熟悉 Vitis AI 的用户了解,这个工具和 IP 有时会遇到不支持的网络层,导致部署失败。不受 Vitis AI 工具与 DPU IP 支持的这些网络层将被逐一划分给 CPU 处理器,用户需要手动处理 DPU 和 CPU 之间的数据交换,这个过程会影响用户体验。

http://news.vvfanli.com/wp-content/uploads/2022/03/20220316064825-6231883973a3d.png

在 Vitis AI 2.0 中,自定义 OP 流程提供更简便的模型部署途径。对于 DPU 不支持的 OP,这种方法在用 Graph Runner 对它们进行部署之前,先在量化流中定义这些 OP,然后完成注册和实现。通过这种方法,用户可以轻松部署完整模型,避免在流程中出错。

http://news.vvfanli.com/wp-content/uploads/2022/03/20220316064826-6231883a48374.png

WeGO Tensorflow 推理流程:

新版本中在易用性方面取得突破性进展的另一体现是引入了全图形优化器 (WeGO) 流。这是将 Vitis AI 开发套件与该框架集成后,从 Tensorflow 直接推断的结果。在 Vitis AI 2.0 中,WeGO 可用于 TensorFlow 1.x 框架以及数据中心版本 DPU 上的AI推断。

WeGO 自动为 Vitis AI 量化器量化的模型执行子图划分,可以优化并加速数据中心端DPU子图应用。DPU 不支持的图形部分将拆分给 Tensorflow,在 CPU 上执行。整个过程对用户完全透明,依托对框架内原生的所有层的支持,以及数据中心端 DPU 上更优异的性能,整体易用性得到了进一步提升。

2

全新模型

AI 模型库已成为 Vitis AI 堆栈中用户最常使用的组件之一。它提供了能够适用于多种视觉场景的免费、开放且可再训练的优化模型。在 Vitis AI 2.0 版本中,免费模型的数量已增至 130 个,覆盖主流框架 Pytorch、Tensorflow、Tensorflow 2 和 Caffe 。

部分新增模型如 SOLO、Yolo-X、UltraFast、CLOC、SESR、 DRUNet、SSR、FADNet、PSMNet、FairMOT。这些模型可广泛用于目标检测、分割、激光雷达成像传感器融合、医疗成像处理、基于 2D 和 3D 的深度估算、用于情感检测再识别、客户满意度和开放信息提取的NLP模型等。除了这些经过训练的模型,新版本也提供了能够提高模型准确性与硬件性能的 OFA 搜索模型。

http://news.vvfanli.com/wp-content/uploads/2022/03/20220316064827-6231883b4b3e2.png

3

DPU 可扩展性和新硬件平台

Vitis AI 2.0 新增对 VCK190、VCK5000 量产板和新硬件 Alveo U55c 的支持。到目前,从嵌入式到数据中心,Vitis AI 全面支持所有主要的器件或加速器卡,包括 Zynq Ultrascale+ MPSoC、Versal ACPA 和 Alveo 卡。

http://news.vvfanli.com/wp-content/uploads/2022/03/20220316064828-6231883c62251.png

边缘和云平台上的 DPU IP 都已升级以实现更多功能,如 Conv3D、Depthwise Conv、h-sigmoid、h-swish 等。Versal Edge DPU 能从 Batch 1 到 Batch 5 支持 C32 模式和 C64 模式,加强 DPU 与定制应用集成的灵活性。

http://news.vvfanli.com/wp-content/uploads/2022/03/20220316064829-6231883dbad3e.png

除了上述新特性,赛灵思还改进了 Vitis AI 工具链的功能与性能,由此 AI 量化器与编译器均支持自定义 OP,且都支持更高版本的 Pytorch (v1.8-1.9) 和 Tensorflow (v2.4-2.6)。

AI 编译器、基于全新算法的Optimizer、AI Library、VART、AI Profiler和 WAA 都支持本次发布的新增模型和自定义OP 流程等。

审核编辑:郭婷

<!–

免责声明:文章内容不代表本站立场,本站不对其内容的真实性、完整性、准确性给予任何担保、暗示和承诺,仅供读者参考,文章版权归原作者所有。如本文内容影响到您的合法权益(内容、图片等),请及时联系本站,我们会及时删除处理。

作者: admin

为您推荐

智慧路灯照明系统的应用为智慧城市的发展建设添砖加瓦

智慧路灯照明系统的应用为智慧城市的发展建设添砖加瓦

智慧路灯照明系统的应用为智慧城市的发展建设添砖加瓦-夜间的路灯不仅照亮了黑暗的街道,而且照亮了回家的道路。从街上望去,闪烁的路灯发出暖光,指引着我们家的方向。城市里的路灯就像“守护者”,给长途旅行回来的游客带来了极大的安全感。 当今,路灯智能控制时代的到来,极大地促进了传统路灯的人工机械化运行。虽然对此感到兴奋,但我们不禁要问:随着路灯智能控制的早期到来,除了改善路灯的运行模式,还能带来什么? 为城市交通提供安全保障 城市公共照明系统中的智能路灯在每个路

晶振在五种不同行业中的应用说明

晶振在五种不同行业中的应用说明-晶振在五种不同行业的应用-由TST嘉硕代理KOYU光与电子

几种不同的物联网控制APP模式

本文就简单介绍当前几种物联网控制APP模式,让大家了解几种不同的技术路线。\” />

<meta http-equiv=X-UA-Compatible content=\"IE=edge,chrome=1

苹果稳坐全球可穿戴设备数量首位,占据日本市场超7成份额

苹果稳坐全球可穿戴设备数量首位,占据日本市场超7成份额

苹果公司占据2021年日本第四季度可穿戴设备71.5%份额,占据全球可穿戴设备市场34.9%份额。\” />

<meta http-equiv=X-UA-Compatible content=\"IE=edge,chrome=1

如何用GPUDirect存储器如何缓解CPU I / O瓶颈

除了使用 GPUs 而不是 CPU 加快计算的好处外,一旦整个数据处理管道转移到 GPU 执行,直接存储就起到了一个力倍增器的作用。这一点变得尤为重要,因为数据集大小不再适合系统内存,而且 GPUs 的数据 I / O 增长成为处理时间的瓶颈。当人工智能和数据科学继续重新定义可能的艺术时,启用直接路径可以减少甚至完全缓解这个瓶颈。\” />

<meta http-equiv=X-UA-Compatible content=\"IE=edge,chrome=1

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注

返回顶部