TechDay实录 | 认识PaddlePaddle:更低使用成本、更高开发效率的深度学习框架

拓朴苔原
• 阅读 1817

导读:

在人工智能时代,各行各业都在尝试利用机器学习/深度学习等前沿技术来解决自身的业务需求,深度学习框架也应运而生。为了继续帮助AI开发者们在深度学习的道路上快速升级,百度PaddlePaddle于2019年重磅启动系列技术公开课“PaddlePaddle TechDay”。

2019年1月5日,第一期活动于北京中关村创业大街百度大脑创新体验中心展开,秉承着“技术为先,应用至上”的理念,百度邀请深度学习技术平台主任工程师胡晓光和高级算法工程师、百度认证布道师胡晓曼作为此次主讲嘉宾,分享PaddlePaddle框架设计原理、实现方式、完整实例等技术点,并结合百度自身AI实践的应用发展,详解PaddlePaddle针对深度学习模型的应用、训练与优化等具体细节。

以下为胡晓光讲师的演讲实录:

2012年,百度开始深度学习的应用,其深度学习框架内部版本可追溯到2013年,到2016年,为了满足开发者的使用需求,百度开源了深度学习平台PaddlePaddle,2018年底,百度又推出了PaddlePaddle Suit,力求框架使用成本越来越低。

如今,各大巨头公司都在进入深度学习领域,那深度学习框架为何如此重要?其实深度学习框架相当于传统的操作系统,起到连接底层硬件和上层应用场景的作用,以此支持各种AI相关的应用,使其与业务结合,实实在在解决业务场景中的问题。例如,通过该框架,可以将底层的CPU、GPU、FPGA、专用AI芯片、手机移动端上的芯片等各类硬件相关隔离并进行管理;在中间层将数据进行组网、训练,进一步得到模型进行预测;在应用层,还可以跟语音、NLP、视觉、推荐等实际场景中的业务进行结合。

可以看到,PaddlePaddle致力于通过输出领先的深度学习技术,赋能各行各业,全方位满足企业级深度学习的应用;同时,PaddlePaddle更加注重用户的开发成本,以最少的时间获得最满意的功能和效果。

支持不同层级开发者需求的PaddlePaddle全功能套件

如上图所示,PaddlePaddle的整体架构主要包含四个层面:核心框架、辅助工具、通用技术方案、服务平台。

核心框架包括:PaddlePaddle训练框架、PaddlePaddleServing(预测)、PaddlePaddle Mobile(移动端手机上可部署),在这个基础框架之上,可以做深度学习相关的工作。

再往上一层,针对深度学习应用的辅助工具包括:Visual DL可视化工具、Auto DL网络自动设计工具、PARL强化学习工具。

通用技术方案上,目前PaddlePaddle主要支持包括文本处理/NLP、CV 、智能推荐相关的三个方向,这三个方向里有大量的模型。

服务平台方面,面向用户实际业务场景,Easy DL无需用户写代码,便可低成本获取定制化服务;此外,还有学习深度学习的平台AI Studio、针对深度学习云服务的Infinity。

PaddlePaddle设计思想

具体到执行流程,通常前端程序是用Python来写的,但实际代码程序是在后端的C++语言环境下实现的,那二者是如何关联起来的呢?

在Python前端,有一个接口可做到前后端的调度,中间还有一个程序ProgramDecs,可进行网络结构的序列化。然后将Programdesc通过接口传给Transpiler,对原始Program做进一步优化,再传给一个新的Programdesc。而在C++后端有一个执行器,这里面对各种各样的Operator进行计算和调用,相当于在CPU上跑的各种指令在这里完成。之后,像梯度或参数等计算结果跑出来后,需要返回预测值,还是通过这个接口再传给Python前端。也就是说,输入数据和返回的结果都是可以在前端完成的。正因如此,整个框架后端是基于C++的,效率也十分高。

执行过程

编译期:定义Program

  1. 编译时,用户编写一段python程序,通过调用 Fluid 提供的算子,向一段 Program 中添加变量(Tensor)以及对变量的操作(Operators 或者 Layers)。用户只需要描述核心的前向计算,不需要关心反向计算、分布式下以及异构设备下如何计算。
  2. 原始的 Program在平台内部转换为中间描述语言: ProgramDesc。
  3. 编译期最重要的一个功能模块是 Transpiler。Transpiler 接受一段 ProgramDesc ,输出一段变化后的 ProgramDesc ,作为后端 Executor 最终需要执行的 Fluid Program
  4. 后端 Executor 接受 Transpiler 输出的这段 Program ,依次执行其中的 Operator(可以类比为程序语言中的指令),在执行过程中会为 Operator 创建所需的输入输出并进行管理。

执行期:1.执行Program

2.创建Executor

Fluid中使用fluid.Executor(place)创建Executor,place属性由用户定义,代表程序将在哪里执行。

下例代码表示创建一个Executor,其运行场所在CPU内:

3.运行Executor

Fluid使用Executor.run来运行程序。定义中通过Feed映射获取数据,通过fetch_list获取结果:

官方支持最多模型库——PaddlePaddle Fluid模型库

目前,基于PaddlePaddle框架基础上开发了大量的模型,可以支持像CV、NLP、推荐等各类非常前沿的技术应用。值得一提的是,模型应用有很多已经放在GitHub上开源出来,如果开发者想要进一步尝试PaddlePaddle,除了查看官方文档,也可以在GitHub上快速找到PaddlePaddle最新开源的模型。

目前来看,PaddlePaddle官方支持的模型数量超过其他主流框架,主要包括计算机视觉里的图像分类、目标检测、人脸检测、关键点、OCR识别、语义分割、视频分类,自然语言处理里的中文词法分析、语义匹配、机器翻译,个性化推荐模型,语音识别等。

1.图像分类

目前网络模型主要朝着两个方向发展:一是越来越深;二是越来越复杂。如AlexNet、VGG、GoogleNet、ResNet、Inception-v4、MobileNet、Dual Path Network、SE-ResNeXt,2012年以来的经典图像识别网络都包含在PaddlePaddle的图像分类模型库里。

2.目标检测 SSD

Single Shot MultiBoxDetector (SSD) 是目标检测领域较新且效果较好的检测算法之一,具有检测速度快且检测精度高的特点。

对比 Faster R-CNN和SSD在GPU上的运行速度和准确率,可以得知,Faster R-CNN的准确率会很高,但跑得速度会慢些;而SSD会快很多,但准确率会低些。

3.人脸检测 PyramidBox

在图像检测里,人脸检测是比较特殊的,包括人脸拍照、人脸识别解锁,其核心基础都是检测。2018年,百度最新推出的PyramidBox,可以说是迄今最好的人脸算法。除了传统算法之外,重点考虑人脸的上下文特征,可以很好地提升人脸检测的交互率和准确率。

4.语义分割DeepLab V3+、语义实时分割ICNet

目前,用于语义分割的DeepLab V3+模型基于PaddlePaddle得到了实现,并取得了非常好的效果。可以看到,它有一些操作并不是标准的卷积,这意味着有可以针对这些操作进行更深入底层优化的空间。

5.视频分类

视频分类方法主要包含基于卷积神经网络、基于循环神经网络、或将这两者结合的方法,目前包含Temporal Segment Network(TSN)模型。

6.中文词法分析(LAC)

中文词法分析(Lexical Analysis of Chinese)是一个联合的词法分析模型,包括中文分词、词性标注、专有名词识别任务。LAC基于一个堆叠的双向GRU结构,在长文本上准确复刻了百度AI开放平台上的词法分析算法。这三个任务可以做一个训练,其效果是非常显著的。

7.语义匹配 DAM

在最新发表的“Multi-Turn Response Selection for Chatbotswith Deep Attention Matching Network”论文中指出,主要使用了全局方法的网络结构,可判断全局信息,通过上下文表示句子语义结构,目前已在内部如聊天或对话系统中取得了非常好的效果。

8.机器翻译 Transformer

从2017年起提出的Transformer现已成为业界机器翻译模型训练的标配。Transformer是一个基于自注意力机制的机器翻译模型,其中不再有RNN或CNN结构,而是完全利用Attention学习语言中的上下文依赖。

9.个性化推荐模型

PaddlePaddle对推荐算法的训练提供了完整的支持,并提供了多种模型配置供用户选择,包括:TagSpace、GRU4Rec、SequenceSemanticRetrieval、DeepCTR、Multiview-Simnet。

模型库:

https://github.com/PaddlePadd...

总结来讲,PaddlePaddle是一个功能全面而又特别注重实用性的框架,百度在生产环境的打磨使其具备了强大的工业级生产能力,同时从框架的内部设计和实现上注重接口的简洁性和稳定性,并规避了复杂概念和设计的引入,使其降低了PaddlePaddle的开发门槛,对开发者也更加友好。此外,开放出大量支持最新主流的模型库,从而全方位为企业开发者提供帮助,使其可以顺畅地进行上层开发。当前仍处于深度学习研究和应用的持续火热期,深度学习框架及平台在研究界和工业界的需求仍持续增长,百度PaddlePaddle也将随着深度学习在各行各业的广泛应用,持续迭代和更新,为中国开发者和企业提供更强、更贴近需求的服务,我们也欢迎广大开发者和企业加入到百度PaddlePaddle的大家庭当中来,共建深度学习生态,助力AI落地。

点赞
收藏
评论区
推荐文章
Stella981 Stella981
3年前
GitHub 热榜:天才黑客开源新项目,不到 1000 行代码,1400 Star!
△点击上方“Python猫”关注,回复“1”领取电子书!(https://oscimg.oschina.net/oscnet/66bff4e5910b4d44847fbe80bf0e7552.png)来自机器之心在深度学习时代,谷歌、Facebook、百度等科技巨头开源了多款框架来帮助开发者更轻松地学习、构建和
Wesley13 Wesley13
3年前
AI领域最最最稀缺的人才——AI架构师
分布式技术是深度学习技术的加速器。同时利用多个工作节点,分布式地、高效地训练出性能优良的神经网络模型,能够显著提高深度学习的训练效率、进一步增大其应用范围。《首席AI架构师——分布式高性能深度学习实战培养计划》,力图从更宽的视角,梳理清楚深度学习框架、AI应用、部署上线的整个环节,让你在AI职业规划上可以多一些选择。!(https
Stella981 Stella981
3年前
Spark如何与深度学习框架协作,处理非结构化数据
随着大数据和AI业务的不断融合,大数据分析和处理过程中,通过深度学习技术对非结构化数据(如图片、音频、文本)进行大数据处理的业务场景越来越多。本文会介绍Spark如何与深度学习框架进行协同工作,在大数据的处理过程利用深度学习框架对非结构化数据进行处理。Spark介绍Spark是大规模数据处理的事实标准,包括机器学习的操
Stella981 Stella981
3年前
PaddlePaddle Windows环境安装
PaddlePaddle(https://www.oschina.net/action/visit/ad?id1185)作为国内首个深度学习框架,最近发布了更加强大的Fluid1.2版本,增加了对Windows环境的支持,全面支持了Linux、Mac、Windows三大环境。PaddlePaddle(https://www.oschina.n
迁移学习核心技术的开发与应用
一、机器学习简介与经典机器学习算法介绍1.什么是机器学习?2.机器学习框架与基本组成3.机器学习的训练步骤4.机器学习问题的分类5.经典机器学习算法介绍章节目标:机器学习是人工智能的重要技术之一,详细了解机器学习的原理、机制和方法,为学习深度学习与迁移学习打下坚实的基础。二、深度学习简介与经典网络结构介绍1.神经网络简介2.神经网络组件简介3.神经网
数据堂 数据堂
1年前
深度学习在语音识别中的应用及挑战
一、引言随着深度学习技术的快速发展,其在语音识别领域的应用也日益广泛。深度学习技术可以有效地提高语音识别的精度和效率,并且被广泛应用于各种应用场景。本文将探讨深度学习在语音识别中的应用及所面临的挑战。二、深度学习在语音识别中的应用1.基于深度神经网络的语音
胡赤儿 胡赤儿
1年前
AI一键去衣技术:窥见深度学习在图像处理领域的革命
AI一键去衣技术:窥见深度学习在图像处理领域的革命随着人工智能技术的飞速发展,深度学习在图像处理领域展现出了强大的潜力。其中,一键去衣(AIbasedClothingRemoval)技术作为其炙手可热的一个分支,吸引了广泛的关注。这项技术利用深度学习算法,
拓朴苔原
拓朴苔原
Lv1
看破是心不颠倒;放下是心不贪恋。
文章
8
粉丝
0
获赞
0