EDA365欢迎您登录!
您需要 登录 才可以下载或查看,没有帐号?注册
x
本帖最后由 EDADZE365 于 2021-5-26 13:42 编辑 b0 K- b& z! u# C, Z) i
$ X3 Z8 h/ P' H( b
赛灵思近期推出重磅活动,2495 美元的优惠价购买用于 AI 推断的 VCK5000 Versal™ 开发卡,VCK5000 的计算能力比当前的服务器级 CPU 高 100 倍,MLPeRF 推断性能也高于当前的服务器级 GPU,是云加速和边缘计算应用的理想开发平台。 ' w x- c3 g( \% d
# v3 n1 ~( c; P9 qVCK5000 Versal 开发卡搭载赛灵思 Versal 自适应计算加速平台 [ACAP]XCVC1902 器件,该器件采用台积电 7nm 技术制造,拥有 400 个以 1.25GHz 运行的 AI 引擎 [AIE],结合可编程逻辑 [PL]内的 1968 个 DSP 引擎结合,可提供高达145 TOPS [INT8] 的 AI 推断算力。此外,它还提供了大量片上存储器,可用来存储特征图或中间数据,从而进一步提高 AI 推断效率。
" s4 n& b6 Z0 u: p- I根据 MLCommons™ 近期发布的 MLPerf™ 推断 v1.0 测试结果,在服务器场景下, VCK5000 帮助 Resnet50 达到了 5,921fps 的性能;在数据中心封闭域的离线场景下,实现了 6,257fps 的性能。在相同的基准测试中,与英伟达的 T4 GPU 卡相比性能提高 9%,后者被广泛应用于数据中心和本地部署的 AI 推断。
+ p, y" i" A$ p f6 y0 e& s
1 N2 z6 V! ?7 _( A! s( d& }Vitis™ AI 1.3.1 版完全支持 VCK5000,它有两种 DPU 变型 [AH1] ,分别采用 384 个和 288 个 AIE 内核。它可以从 Vitis AI Model Zoo 中为不同的分类、检测和分段任务 [AH2] 运行超过 50 种 AI 模型,其中包括 Resnet、Yolov3、SSD、Unet、Openpose、SalsaNext 等。
' e. M3 a E7 F: n我们已经为 VCK5000 构建了两个演示,分别是用 BERT 进行自然语言处理和 MLPerf 1.0 Submission Resnet-50。您可以快速运行它们以查看性能结果,演示包可通过申请获得。 VCK5000 的 AI 性能可以随 DPU 使用的 AIE 内核数量进行扩展。根据您的 AI 应用的性能需求,它可以用相同的软件协议栈部署在云上或部署在本地。 ( P( @5 D! o- b/ N( R
为了更好的向开发者介绍VCK5000的详细内容和如何特惠价购买,赛灵思特邀请三位专家于05.23日进行 VCK5000 的技术分享:
1 s0 W+ r6 Q8 J. g如何在Alveo versal上快速部署AI推断 - VCK5000助力软件/AI开发升级 时间:2021.05.23 19:30-22:00
% l; c9 X, N* {0 m2 {
* D, \7 ~$ X7 P; W# x |