干货!天翼云DPU技术解码

天翼云开发者社区
• 阅读 316

9月2日,第二届SmartNIC&DPU技术创新峰会在京举行,天翼云在2022 SmartNIC&DPU Awards年度评选中荣获匠芯技术奖。天翼云资深研发专家刘禄仁出席SmartNIC&DPU技术分会场并发表“天翼云DPU技术研究和实践”主题演讲,向行业分享天翼云以DPU为核心的新一代计算架构的研究及场景落地。 干货!天翼云DPU技术解码

随着数据量爆发式增长,数据中心规模持续扩大,驱动网络带宽不断升级,以满足当前和未来云端海量数据流需求。在摩尔定律明显放缓的背景下,随着更高带宽的到来,CPU算力增长速度和数据中心网络传输速率增长速度的差距被逐渐拉大,效率更高的计算芯片成为刚需,DPU应运而生。

DPU作为计算负载的引擎,直接效果是给CPU“减负”,能够提高数据中心的运算效率,减少能耗浪费,进而降低成本,在数字时代具有巨大的商业价值与发展潜力。

天翼云作为国内领先的云服务商,抢跑DPU赛道,基于当前DPU技术演进路线,结合需求的零散化、动态变化以及对DPU产品线上运维问题的考量,以FPGA+CPU的架构作为切入点,成功研发出天翼云DPU1.0产品,并以DPU云核为基础打造了为云而生的全新云计算体系结构。 干货!天翼云DPU技术解码

天翼云DPU1.0实现了虚拟化的零损耗,具备高性能、低延迟、低抖动的特性,网络转发性能高达4000万PPS,存储云盘IOPS可以达到60W。此外,天翼云DPU1.0还可以将传统运行在主机侧的应用转到DPU云核上,减少大量的适配工作,在主机不同算力核和不同架构上做到即插即用。

在天翼云DPU1.0产品从研发到落地的过程中,天翼云DPU团队在网络、存储及RDMA方面进行了丰富的实践。

在网络卸载方面 针对流表数量大、转发性能要求高、对SoC和FPGA的内存容量需求大、稳定性要求高等挑战,天翼云对rte_flow等主要数据结构进行压缩,并对流表空中计算,优化裁剪offload卸载路径的多层级缓存,从而支持4M流表,实现了内存优化;对所有流表进行合并计算,避免在硬件层执行包重注,使转发效率达到4000万PPS;

基于硬件精确流表特点设计专用老化统计线程,减轻OVS Revalidator压力;初步拆分OVS的统计和老化事务逻辑,优化硬件流表的老化统计上报实现逻辑,提升软件OVS Revalidator执行效率;支持热升级、热迁移及热恢复,做到B/V/C全场景的并池,大幅提升稳定性。

在存储卸载方面 针对经常出现的SoC异常重启、SPDK异常重启、热迁移丢IO等现象,天翼云从中抽象出共同特性,利用软件协同的思想,将SoC侧软件的正常行为和异常行为进行统一,组件启动时统一发送msg信息给硬件,硬件收到该msg会解析其内容,进而从硬件保存的queue指针信息进行分析,在用户无感状态下实现全部异常的统一化处理。

在高性能网络方面 拥塞算法是RDMA的核心和关键,为提高RDMA网络的性能,天翼云聚焦下一代高效CC算法设计,以更好地避免拥塞、保证公平性,实现更快速收敛、更低时延、更简单部署。针对不同应用场景,天翼云设计了2套算法eSurfing-CC:

▎针对智能网卡+商用交换机的组合,提出基于RTT+CNP的2段式端到端CC算法,具有主动拥塞控制、无需依赖交换机的配置、支持快速启动快速收敛等优势; ▎针对智能网卡+可编程交换机的组网场景,在交换机上部署CC算法,使交换机同样具备主动拥塞通知能力和主动发包能力,可以有效降低端到端响应时延,同时简化建模和配置复杂度,提高系统的可扩展性。

目前,基于天翼云DPU核心技术打造的多款产品已落地应用,以天翼云弹性裸金属服务器为例,该服务器兼具云服务器弹性和物理机性能,通过将网络、存储等功能卸载至DPU卡,可极大降低物理机侧CPU和内存等资源消耗,最终算力远超普通云主机,现已服务于金融、汽车等多行业企业。 干货!天翼云DPU技术解码 干货!天翼云DPU技术解码

会上,还发布了2022 SmartNIC&DPU Awards年度评选结果,天翼云凭借以DPU云核为基础打造的全新一代云计算体系结构,荣获匠芯技术奖。该体系结构将计算、存储、网络和安全算力迁移到自研的软硬结合体系中,构建了面向不同算力、全国产化自主可控的第二平面,可实现网络、计算、存储资源云化加速,在DPU领域极具创新性。

DPU、CPU、GPU将成为未来计算市场的三大支柱,DPU作为计算市场的“芯”生事物,在技术标准和生态方面仍处于早期阶段,具有广阔的发展前景。未来天翼云将持续探索DPU技术,不断完善DPU产品,助力海量算力高效释放,助推数字经济发展。

点赞
收藏
评论区
推荐文章
公众版与政企版,这两款云电脑我都要!
8月18日,以“自主领先,畅游云端”为主题的天翼云电脑专题讲座在线上召开。天翼云科技有限公司研发二部高级产品经理梁胜蓝作为主讲人,对天翼云电脑不同版本的功能、特点进行了介绍,并分享了天翼云电脑在政企办公、在线教学等不同场景中的应用实践。近年来,随着5G、云计算等新兴技术快速发展,数字化办公正在成为企业办公的一大趋势。天翼云电脑具有便捷易用、安全可信等优势,可
加快云网融合发展,打通算力传输大动脉!
8月24日25日,第六届未来网络发展大会在南京举办,天翼云受邀参加25日举办的“云网融合与云原生网络论坛”。天翼云研发一部副总经理杨鑫发表题为《天翼云网络及云网融合实践》的演讲,详细介绍了天翼云网络技术与产品特性和布局,以及在多个行业中的云网融合应用实践。如今,数字经济底座正从连接为主的网络基础设施向云网融合的数字信息基础设施加速演进。天翼云历经十年发展,构
畅享高性能计算!天翼云HPC解决方案来了
6月15日,“天翼云HPC解决方案加速企业数字化转型”专题讲座在线上召开,天翼云科技有限公司高级解决方案经理梁小彪、天翼云科技有限公司高级工程师孙晓宁作为主讲人,分别对天翼云HPC解决方案及应用、天翼云高性能计算产品做了分享。在十四五规划与双碳目标的驱使下,高性能计算的技术研发越来越重视低碳减耗。随着互联网应用场景不断拓展,数据流量爆发式增长,企业对高性能
天翼云探索云原生、边缘计算融合新思路
6月15日,由中国信息通信研究院、中国通信标准化协会主办的云原生产业大会在线上成功举办。天翼云研发三部副总经理鄢智勇、天翼云研发三部研发专家胡建锋发表了演讲,分别就当今时代算力的重要性和云原生在算力网络中的实践、云原生技术发展趋势以及天翼云的创新举措进行了分享。数字化转型脚步加快,云原生在行业的落地应用随之深入。云原生技术作为数字技术发展“内核”,不断促
云原生平台,让边缘应用玩出花!
7月14日,由云原生计算基金会(CNCF)、KubeEdge社区主办的首届云原生边缘计算峰会在线上召开。会上,天翼云科技有限公司高级研发经理张其栋发表主题演讲,就云边一体云原生平台如何助力边缘应用落地进行了分享。近年来,互联网流量爆发式增长,带来大量的流量调度业务需求,驱动CDN市场快速发展。天翼云于2020年开启CDN产品的规模商用,到目前为止,已经实现了
第二届SmartNIC&DPU技术创新峰会即将开幕,速来围观!
9月2日,聚焦于智能网卡与DPU相关技术的第二届SmartNIC&DPU技术创新峰会将在北京举行。天翼云资深研发专家刘禄仁将出席会议并发表“天翼云DPU技术研究和实践”主题演讲,向行业展示以DPU为核心的新一代架构,并分享天翼云在DPU技术上的思考、研究及落地实践。近年来,新一代信息技术的迅速发展与普及带来云、边、端的数据井喷,给网络带来了更多元复杂的需求,
天翼云加码边缘计算,让普惠算力触手可及!
8月25日,亚太内容分发大会暨CDN峰会在京召开。大会汇集CDN产业领军企业,聚焦产业前沿科技突破,共同探讨边缘计算发展趋势与创新应用。天翼云科技有限公司高级研发经理张其栋出席“边缘计算论坛”并发表主题演讲,分享了天翼云边缘计算的发展规划与实践案例。天翼云科技有限公司高级研发经理张其栋当前,边缘计算发展势头强劲,Gartner预计到2025年将有超过75%的
2022世界人工智能大会开幕,天翼云注智城市数字化转型
9月1日,2022世界人工智能大会在上海世博中心拉开帷幕。天翼云科技有限公司首席专家侯圣文出席9月2日中国电信“云网注智赋能城市”分论坛,并发表“天翼云上数智最佳实践”主题演讲,分享了天翼云在云上数智方面的能力积累与技术创新,以及在助力智慧城市建设、推动社会治理发展和支撑数字经济转型中发挥出的巨大赋能作用。近年来,我国人工智能技术发展迅猛,并广泛应用于各个
重磅发布!《天翼云白皮书》+天翼云紫金DPU来了!
12月29日,由中国电信主办的“2022天翼数字科技生态大会”在云端召开。会上,中国电信总经理邵广禄发布了天翼云两项重要成果——《天翼云白皮书》和天翼云紫金DPU。《天翼云白皮书》阐述了发展愿景、发展目标、演进路径、关键举措,并在天翼云发展愿景和使命方面这
殊荣双至,天翼云边缘计算再获两项大奖!
近日,全球边缘计算大会·北京站在新世界大酒店成功召开。大会公布了“2023金边奖”评选结果,天翼云斩获“最佳智能边缘云服务商”“最佳边缘安全加速平台”两项大奖。天翼云边缘计算产品专家熊瑶、天翼云边缘安全产品专家杜茜参加会议并分别发表演讲,分享了天翼云边缘计算发展规划与实践。
天翼云开发者社区
天翼云开发者社区
Lv1
天翼云是中国电信倾力打造的云服务品牌,致力于成为领先的云计算服务提供商。提供云主机、CDN、云电脑、大数据及AI等全线产品和场景化解决方案。
文章
494
粉丝
8
获赞
37