找回密码
 注册
关于网站域名变更的通知
查看: 3408|回复: 1
打印 上一主题 下一主题

【5月23日 赛灵思 X 电巢直播】如何在Alveo Versal上快速部署AI推断 - VCK5000助力...

[复制链接]

该用户从未签到

跳转到指定楼层
1#
发表于 2021-5-23 11:49 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式

EDA365欢迎您登录!

您需要 登录 才可以下载或查看,没有帐号?注册

x
本帖最后由 EDADZE365 于 2021-5-26 13:42 编辑
1 d0 o- Q7 z5 X4 w" H; z& g. ^5 z, j) c# J! k% {
赛灵思近期推出重磅活动,2495 美元的优惠价购买用于 AI 推断的 VCK5000 Versal™ 开发卡,VCK5000 的计算能力比当前的服务器级 CPU 高 100 倍,MLPeRF 推断性能也高于当前的服务器级 GPU,是云加速和边缘计算应用的理想开发平台。
; }& P& u; F) `+ e4 s+ t

$ e5 A+ M7 p( O9 Q* M: r% g) P
VCK5000 Versal 开发卡搭载赛灵思 Versal 自适应计算加速平台 [ACAP]XCVC1902 器件,该器件采用台积电 7nm 技术制造,拥有 400 个以  1.25GHz 运行的 AI 引擎 [AIE],结合可编程逻辑 [PL]内的 1968 个 DSP 引擎结合,可提供高达145 TOPS [INT8] 的 AI 推断算力。此外,它还提供了大量片上存储器,可用来存储特征图或中间数据,从而进一步提高 AI 推断效率。

& n1 d+ |, u1 w5 i1 L$ W
根据 MLCommons™ 近期发布的 MLPerf™ 推断 v1.0 测试结果,在服务器场景下, VCK5000 帮助 Resnet50 达到了 5,921fps 的性能;在数据中心封闭域的离线场景下,实现了 6,257fps 的性能。在相同的基准测试中,与英伟达的 T4 GPU 卡相比性能提高 9%,后者被广泛应用于数据中心和本地部署的 AI 推断。
1 f% }# H- ^" L

# \( C& Q2 D1 S: b
Vitis™ AI 1.3.1 版完全支持 VCK5000,它有两种 DPU 变型 [AH1] ,分别采用 384 个和 288 个 AIE 内核。它可以从 Vitis AI Model Zoo 中为不同的分类、检测和分段任务 [AH2] 运行超过 50 种 AI 模型,其中包括 Resnet、Yolov3、SSD、Unet、Openpose、SalsaNext 等。
  @1 M7 Y& \5 X9 H2 {9 H8 s) X
我们已经为 VCK5000 构建了两个演示,分别是用 BERT 进行自然语言处理和 MLPerf 1.0 Submission Resnet-50。您可以快速运行它们以查看性能结果,演示包可通过申请获得。
VCK5000 的 AI 性能可以随 DPU 使用的 AIE 内核数量进行扩展。根据您的 AI 应用的性能需求,它可以用相同的软件协议栈部署在云上或部署在本地。
$ f8 X* F) |6 c  a
为了更好的向开发者介绍VCK5000的详细内容和如何特惠价购买,赛灵思特邀请三位专家于05.23日进行 VCK5000 的技术分享:

; D/ X, N& i. {+ c3 b9 `; z) N
如何在Alveo versal上快速部署AI推断 - VCK5000助力软件/AI开发升级
时间:2021.05.23 19:30-22:00

7 {; K/ O/ C$ N6 d
7 d* g* d6 D" t) q! q
您需要登录后才可以回帖 登录 | 注册

本版积分规则

关闭

推荐内容上一条 /1 下一条

EDA365公众号

关于我们|手机版|EDA365电子论坛网 ( 粤ICP备18020198号-1 )

GMT+8, 2025-9-7 03:05 , Processed in 0.125000 second(s), 27 queries , Gzip On.

深圳市墨知创新科技有限公司

地址:深圳市南山区科技生态园2栋A座805 电话:19926409050

快速回复 返回顶部 返回列表