腾讯优图开源深度学习推理框架TNN,助力AI开发降本增效

惰性潮汐
• 阅读 3178

从学界到工业界,“开源”已经成为AI领域的一个关键词。一方面,它以“授人以渔”的方式为AI构建了一个开放共进的生态环境,帮助行业加速AI应用落地;另一方面,在解决行业实际问题时持续更新和迭代,源源不断地给AI领域输送重要的技术养料和创造力,可以说开源是AI落地和繁荣不可或缺的源动力。

腾讯优图开源深度学习推理框架TNN,助力AI开发降本增效

6月10日,腾讯优图实验室宣布正式开源新一代移动端深度学习推理框架TNN,通过底层技术优化实现在多个不同平台的轻量部署落地,性能优异、简单易用。基于TNN,开发者能够轻松将深度学习算法移植到手机端高效的执行,开发出人工智能 APP,真正将 AI 带到指尖。

轻量级部署,TNN助力深度学习提速增效

深度学习对算力的巨大需求一直制约着其更广泛的落地,尤其是在移动端,由于手机处理器性能弱、算力无法多机拓展、运算耗时长等因素常常导致发热和高功耗,直接影响到app等应用的用户体验。腾讯优图基于自身在深度学习方面的技术积累,并借鉴业内主流框架优点,推出了针对手机端的高性能、轻量级移动端推理框架TNN。

TNN在设计之初便将移动端高性能融入核心理念,对2017年开源的ncnn框架进行了重构升级。通过GPU深度调优、ARM SIMD深入汇编指令调优、低精度计算等技术手段,在性能上取得了进一步提升。以下是MNN, ncnn, TNN框架在多款主流平台的实测性能:
腾讯优图开源深度学习推理框架TNN,助力AI开发降本增效
腾讯优图开源深度学习推理框架TNN,助力AI开发降本增效
腾讯优图开源深度学习推理框架TNN,助力AI开发降本增效
腾讯优图开源深度学习推理框架TNN,助力AI开发降本增效

TNN在麒麟970、骁龙835、骁龙845,骁龙615平台实测性能数据

注:纵轴单位:ms 测试分支:MNN:1.0.0(2020.05.07), ncnn:20200413, TNN: master(2020.06.10)

测试模型:https://github.com/alohali/benchmark-models

低精度计算的运用对TNN的性能提升发挥了重要作用。在神经网络计算中,浮点精度在许多研究和业务落地成果上都被证明存在一定冗余,而在计算、内存资源都极为紧张的移动端,消除这部分冗余极为必要。TNN引入了INT8、 FP16、 BFP16等多种计算低精度的支持,相比大部分仅提供INT8支持的框架,不仅能灵活适配不同场景,还让计算性能大大提升。TNN通过采用8bit整数代替float进行计算和存储,模型尺寸和内存消耗均减少至1/4,在计算性能上提升50%以上。同时引入arm平台BFP16的支持,相比浮点模型,BFP16使模型尺寸、内存消耗减少50%,在中低端机上的性能也提升约20%。骁龙615平台实测:

腾讯优图开源深度学习推理框架TNN,助力AI开发降本增效
腾讯优图开源深度学习推理框架TNN,助力AI开发降本增效

通用、轻便是TNN框架的另一大亮点。长久以来,不同框架间的模型转换都是AI项目应用落地的痛点。TNN设计了与平台无关的模型表示,为开发人员提供统一的模型描述文件和调用接口,支持主流安卓、iOS等操作系统,适配CPU、 GPU、NPU硬件平台。企业一套流程就能部署到位,简单易用、省时省力。同时, TNN通过ONNX可支持TensorFlow, PyTorch, MXNet, Caffe等多种训练框架,目前支持ONNX算子超过80个,覆盖主流CNN网络。TNN所有算子均为源码直接实现,不依赖任何第三方,接口易用,切换平台仅需修改调用参数即可。

开源文化兴起,AI底层技术助推产业发展

事实上,作为腾讯旗下顶级AI实验室,腾讯优图长期致力于AI基础设施的研发和推进。此前,腾讯优图已开发了Rapidnet 前向计算框架、RapidAIoT 边缘计算框架,实现了业界首个专注移动端的推断框架ncnn的开源,并在业界受到广泛推崇。从2017年开源至今,ncnn在GitHub上star(8.9k)和 fork(2.3k)数均领先于其它各大推理框架。

据悉,TNN已于3月中旬在腾讯内部开源,为腾讯QQ、QQ空间、腾讯微视、腾讯云、天天P图等多款产品和服务中持续提供技术能力,释放出更多效能。

“TNN已在GitHub上开源,欢迎业界人士参与协同共建,共同打造更优的移动端推理框架。“腾讯优图实验室副总经理吴永坚介绍,腾讯优图后续将在现有CV业务的基础上研发更多的AI推理模型,如语音、NLP等相关业务,同时开展针对CPU、GPU服务器端的服务,为业界公司提供更广泛的优化服务。 “作为产业发展的高速公路,以深度学习框架、组件为代表的AI基础设施将是未来的主流趋势,腾讯优图也将以此为着力点,助推产业发展。”吴永坚表示,腾讯优图还将持续开发模型训练组件、模型压缩组件、基础算法组件,并择机开源,希望从框架到平台、到算法,打造一体化的AI基础设施,降低AI门槛,加速产业发展。

随着以开源为代表的新代码文化的兴起,腾讯近年来在开源领域表现亮眼:在全球最大的代码托管平台GitHub上,腾讯发布的开源项目已经超过一百个,涵盖云原生、大数据、AI、云计算、安全、硬件等多个热门的技术方向。

通过开源协同,腾讯将各个事业群最底层和共性的技术能力进行梳理和拉通,在业务实践和海量用户检验下,优质的内部开源项目不仅在公司层面推广复用,同时也对外贡献整个开源社区。仅在Github上,腾讯的开源项目就收获了30w+star数,跻身国际上有影响力的开源企业之一。

在开源的道路上,腾讯不仅将内部优质项目持续对外开放,也积极与开源社区协同合作,发挥中国企业的科技力量,推动开源和开放进一步升级。

开源地址:https://github.com/Tencent/TNN

点赞
收藏
评论区
推荐文章
Stella981 Stella981
3年前
Labelhub 基于腾讯云 Serverless 技术为人工智能企业提供数据与模型解决方案
Labelhub是一家致力于为人工智能企业提供完善的数据与模型解决方案公司,可以帮助AI企业更好的管理数据,从而提高其核心AI产品迭代速度,Labelhub拥有优秀的敏捷团队,开发领域涉及机器学习、模型训练以及软件应用。目前已经与多家大中型企业进行深度合作,在行业相关比赛中也多次获奖。!(https://oscimg.oschina.ne
智汇宁夏,共创未来!天翼云携手宁夏共建“中国算力之都”!
为充分发挥宁夏算力产业基础与优势,聚焦人工智能关键共性技术创新,推动人工智能技术与实体经济深度融合,搭建AI产业应用开发与生态合作平台,6月29日,2024首届算力之都开发者大会暨天翼云智算生态合作大会在宁夏隆重举行。大会以“沙海铸就人工智能,黄河汇集数字洪流”为主题,邀请全球顶尖院士和来自清华大学、北京邮电大学等高校的知名学者、10余家头部模型厂商、3000余名国内外AI开发者和行业精英汇聚一堂,共同探讨AI应用创新的前沿趋势和关键技术,展示AI技术在各个领域的应用成果,推动AI应用的落地和普及。
爱学it学无止境 爱学it学无止境
12个月前
AI全流程落地实战:从设计-开发-测试到运营一站式搞定(完结)
AI全流程落地:从技术到应用的深度剖析随着人工智能(AI)技术的飞速发展,其在各个领域的应用日益广泛,从智能制造到智慧金融,从智慧医疗到在线教育,AI正逐步改变着我们的生活方式和工作模式。本文将深入探讨AI全流程落地的技术细节,从需求分析、技术选型、数据准
幂简集成 幂简集成
6个月前
火爆全网的AI+视频API推荐
AI视频通常指的是由人工智能(AI)技术生成或处理的视频。这可能包括使用深度学习、计算机视觉和其他相关技术来改善视频的质量、内容或生成全新的视频内容。长期以来,人们对AI视频技术应用的认知停留在各种“换脸”和视频特效上。随着AI图像领域的技术发展,AI视频
广州华锐互动 广州华锐互动
2个月前
广州AI数字人的发展趋势​
广州AI数字人产业前景一片光明,充满无限可能。随着技术的持续突破和应用场景的不断拓展,AI数字人将在更多领域发挥重要作用,为广州的经济发展和社会进步注入强大动力。​在技术创新方面,我们有理由期待广州的科研人员和企业在AI数字人技术上取得更多突破。情感交互技
幂简集成 幂简集成
1个月前
2025年国内AI推理大模型效果对比:DeepSeek、通义千问、腾讯混元
随着人工智能技术的飞速发展,AI推理大模型已经成为各行业关注的焦点。2025年,国内AI推理大模型领域呈现出百家争鸣的态势,其中DeepSeek、通义千问和腾讯混元等模型尤为引人注目。本文将从技术架构、性能表现、应用场景等多个维度对这三款模型进行对比分析。
天翼云息壤Triless架构:AI时代的创新引擎!
2025年作为AI应用元年拉开了国产AI深度融入各行业的序幕然而,当前AI大规模落地还面临着三大难题如何高效获取匹配自身业务需求的算力资源?如何选择训练推理框架不受限于智算芯片差异?如何便捷开发量身定制的AI应用?天翼云在息壤平台能力的基础上推出Trile
惰性潮汐
惰性潮汐
Lv1
你曾说过陪我去看一场雪,我在漫漫黑夜静候你的约
文章
4
粉丝
0
获赞
0