TVM 学习教程

Easter79
• 阅读 1103

OpenVINO 是intel针对intel的各硬件(CPU、Moviduis等)在 deployment 环节(inference)进行的性能优化的软件;

TensorRT 是NVIDIA针对NVIDIA GPU在 deployment 环节(inference)进行的性能优化的软件;

deployment 指的是如何将深度学习的模型跑在各种硬件平台上。

TVM 出现的动机:因为深度学习中ASIC芯片的设计并不是难事,但由于深度学习中新硬件的出现,如TPU、NPU等,需要重写这些芯片的上层整个软件栈,比如指令性、主流的深度学习框架等,这是繁琐复杂的工程。

TVM Stack Goal:针对各种CPU、GPU和ASIC等深度学习加速器,开发全栈的深度学习编译器 (从硬件到最终的软件框架)。

上层用户的视角:TVM frontend 前端拿到不同框架的模型后,通过 TVM 编译器编译出 TVM 的模型,然后就能跑在不同的设备上。

为什么这是一件难事:(1)需要与手动优化库进行竞争,TVM 采用的方案是自动优化的方法要比手动的还好(2)需要有前沿的全栈的优化研究 TensorFlow中的XLA主要是对TPU进行的优化,所以一般在GPU上是拼不过cuDNN的。 JIT

TVM Overview 综述

(1)High-level optimization:Computational Graph Optimization,包括 operater fusion(layer fusion、tensor fusion)、memory plan、data layout transform (nchw/nhwc等哪种是最优)等,但图优化需要针对每一种硬件、不同的data layout、不同的数据精度、线程模型等都进行优化操作,但这是相当繁琐的事,所以出现了第二层和第三层。

(2)Tensor Expression Language:主要做的事是描述tensor的计算,使得计算可以使用特殊的操作,比如AVX、TPU指令等。解决不同硬件的差异。

(3)Schedule Optimization Space:整理和总结目前所有的手动优化方案,并放入这个可以供 TVM 进行调度的优化库中。解决data layout、数据精度、线程模型等问题。所以这个搜索空间就包括了所有的手动优化方案,但这个方案的体量是很庞大的,如 1 billion。如何在这个庞大的优化库中搜索到最优的实现,就出现了第四层。 为什么机器优化的方法会比人手动优化的更快?因为机器可以尝试所有的优化方案,而人的优化时间是有限的,不能尝试很多的优化方法。

(4)AutoTVM,Optimize Tensor Operators using Learning:最大的问题是不可能将庞大的优化方法都试一遍,所以通过机器学习的方式,一开始需要将你的模型放在目标设备上进行测试跑分,然后通过优化空间中不同的优化方法对这个模型进行优化后,再次在设备上跑分,得到了优化方法与优化结果的数据,并由此建立一个cost model,用于评估优化方法与优化结果之间的关系,所以最终可以从这个模型中得到最优的优化方法。目前可以查看 AutoTVM API 得到 TVM 的优化方法。最后是模型针对的硬件,如何集成入TVM? TVM RPC:通过远程调用的方式,将你的模型部署到远程目标板或集群上,进行远程调试,如手机。

(5)VTA:开源的硬件加速器栈,包括VTA JIT runtime(实时生成的指令能与进行TVM通信)、VTA ISA、VTA Micro-Architecture以及各硬件,如FPGA等。 查看 tvm 的 discusss 和 roadmap

  当前的TVM只支持inference,在今天2019年9月之后会加入training的相关。  

Step 1:TVM 视频介绍

https://www.bilibili.com/video/av29521815/

Step 2:研读 TVM 论文

原文:https://www.usenix.org/system/files/osdi18-chen.pdf 翻译:https://zhuanlan.zhihu.com/p/79796618 扩展:https://blog.csdn.net/sanallen/article/details/79402174

Step 3:了解 TVM 官网中可以学习的资料

https://tvm.ai/

Step 4:上手 TVM Code

https://github.com/dmlc/tvm

Step 5:TVM 其他相关资料

TVM 讨论:https://discuss.tvm.ai/ CSE 599W Systems for ML:http://jcf94.com/2018/10/04/2018-10-04-cse559w/ 其他介绍:https://daiwk.github.io/posts/platform-TVM.html 陈天奇介绍:https://xmfbit.github.io/2019/06/29/tvm-helloworld/ 陈天奇介绍:https://www.qbitai.com/2019/07/5390.html 知乎评论:https://www.zhihu.com/question/268423574

点赞
收藏
评论区
推荐文章
刚刚好 刚刚好
4个月前
css问题
1、在IOS中图片不显示(给图片加了圆角或者img没有父级)<div<imgsrc""/</divdiv{width:20px;height:20px;borderradius:20px;overflow:h
blmius blmius
1年前
MySQL:[Err] 1292 - Incorrect datetime value: ‘0000-00-00 00:00:00‘ for column ‘CREATE_TIME‘ at row 1
文章目录问题用navicat导入数据时,报错:原因这是因为当前的MySQL不支持datetime为0的情况。解决修改sql\mode:sql\mode:SQLMode定义了MySQL应支持的SQL语法、数据校验等,这样可以更容易地在不同的环境中使用MySQL。全局s
小森森 小森森
4个月前
校园表白墙微信小程序V1.0 SayLove -基于微信云开发-一键快速搭建,开箱即用
后续会继续更新,敬请期待2.0全新版本欢迎添加左边的微信一起探讨!项目地址:(https://www.aliyun.com/activity/daily/bestoffer?userCodesskuuw5n)\2.Bug修复更新日历2.情侣脸功能大家不要使用了,现在阿里云的接口已经要收费了(土豪请随意),\\和注意
晴空闲云 晴空闲云
4个月前
css中box-sizing解放盒子实际宽高计算
我们知道传统的盒子模型,如果增加内边距padding和边框border,那么会撑大整个盒子,造成盒子的宽度不好计算,在实务中特别不方便。boxsizing可以设置盒模型的方式,可以很好的设置固定宽高的盒模型。盒子宽高计算假如我们设置如下盒子:宽度和高度均为200px,那么这会这个盒子实际的宽高就都是200px。但是当我们设置这个盒子的边框和内间距的时候,那
艾木酱 艾木酱
3个月前
快速入门|使用MemFire Cloud构建React Native应用程序
MemFireCloud是一款提供云数据库,用户可以创建云数据库,并对数据库进行管理,还可以对数据库进行备份操作。它还提供后端即服务,用户可以在1分钟内新建一个应用,使用自动生成的API和SDK,访问云数据库、对象存储、用户认证与授权等功能,可专
Stella981 Stella981
1年前
Android So动态加载 优雅实现与原理分析
背景:漫品Android客户端集成适配转换功能(基于目标识别(So库35M)和人脸识别库(5M)),导致apk体积50M左右,为优化客户端体验,决定实现So文件动态加载.!(https://oscimg.oschina.net/oscnet/00d1ff90e4b34869664fef59e3ec3fdd20b.png)点击上方“蓝字”关注我
Wesley13 Wesley13
1年前
MySQL查询按照指定规则排序
1.按照指定(单个)字段排序selectfromtable_nameorderiddesc;2.按照指定(多个)字段排序selectfromtable_nameorderiddesc,statusdesc;3.按照指定字段和规则排序selec
Stella981 Stella981
1年前
Angular material mat
IconIconNamematiconcode_add\_comment_addcommenticon<maticonadd\_comment</maticon_attach\_file_attachfileicon<maticonattach\_file</maticon_attach\
Wesley13 Wesley13
1年前
MySQL部分从库上面因为大量的临时表tmp_table造成慢查询
背景描述Time:20190124T00:08:14.70572408:00User@Host:@Id:Schema:sentrymetaLast_errno:0Killed:0Query_time:0.315758Lock_
helloworld_28799839 helloworld_28799839
4个月前
常用知识整理
Javascript判断对象是否为空jsObject.keys(myObject).length0经常使用的三元运算我们经常遇到处理表格列状态字段如status的时候可以用到vue
helloworld_34035044 helloworld_34035044
7个月前
皕杰报表之UUID
​在我们用皕杰报表工具设计填报报表时,如何在新增行里自动增加id呢?能新增整数排序id吗?目前可以在新增行里自动增加id,但只能用uuid函数增加UUID编码,不能新增整数排序id。uuid函数说明:获取一个UUID,可以在填报表中用来创建数据ID语法:uuid()或uuid(sep)参数说明:sep布尔值,生成的uuid中是否包含分隔符'',缺省为