冠军!天翼云在国际AI顶会大模型挑战赛中拔得头筹!

天翼云开发者社区
• 阅读 130

6月7日,国际人工智能顶会CVPR 2023举办的第一届大模型挑战赛(CVPR 2023 Workshop on Foundation Model:1st foundation model challenge)落下帷幕,本次比赛吸引了来自全球著-名高校和知名企业的1024名参赛者。经过为期2个月的激烈角逐,天翼云AI团队(队名CTRL)在多任务大模型赛道中表现出色,荣获本届大赛冠军。

冠军!天翼云在国际AI顶会大模型挑战赛中拔得头筹!

CVPR会议是由IEEE主办的关于计算机视觉和模式识别的国际学术会议,收录了该领域最新的研究成果和技术发展,是全球计算机视觉三大顶-级会议之一。

                            ✦  ✦  ✦  

传统的视觉模型生产流程通常采用单任务,从零开始训练,各个任务之间无法相互借鉴。由于单任务数据有限,导致模型的实际效果过于依赖任务数据分布,通常对于不同场景的泛化效果不佳。

近年来,大数据预训练技术迅速发展,通过利用大量数据学习通用知识并将其迁移到下游任务中的方法,本质上实现了不同任务之间的相互借鉴。基于海量数据获得的预训练模型具有较好的知识完备性,即使在下游任务中使用少量数据进行微调,仍然能够获得良好的效果。然而,基于预训练+下游任务微调的模型生产流程需要为每个任务单独训练模型,这在研发上消耗了大量资源。相比之下,多任务训练方案通过使用多个任务的数据训练一个功能强大的通用模型,可以直接应用于处理多个任务,从而有效提高模型生产效率和泛化能力。

在本次竞赛中,参赛者需要使用单一模型同时完成交通场景下的分类、检测和分割三个代表性任务的联合训练。天翼云AI团队在模型设计方面凭借丰富的算法开发经验,选择了参数量仅为第2名60%的预训练模型,用更少的参数却获得了更高的精度。

为了解决多任务训练中各分支损失函数和梯度不一致导致收敛缓慢的问题,天翼云AI团队采用了损失均衡和梯度尺度统一的方法,以此来平衡各任务分支的损失函数,并使梯度具有一致的尺度,从而提高模型的训练效率和收敛速度。此外,天翼云AI团队还通过精心设计的任务专属特征金字塔和注意力机制,使各分支任务能够利用骨干网络中对自身任务更有效的特征,进一步提升了整体模型的精度和性能。

通过以上模型设计和训练策略,天翼云AI团队在竞赛中取得了优异成绩,充分展示了在图像、音频及多模态领域的深厚积累和持续创新能力。未来,天翼云将继续在广阔的人工智能领域进行创新和探索,以更先进的技术和卓越的成果惠及更多用户,为千行百业的数字化发展提供支撑。

点赞
收藏
评论区
推荐文章
Wesley13 Wesley13
2年前
4项探索+4项实践,带你了解华为云视觉预训练研发技术
摘要:本文主要讲述云原生时代华为云在AI基础研究、视觉预训练模型研发和行业实践,以及AI开发平台ModelArts的最新进展。近日,在Qcon全球软件开发大会(深圳站)上,华为云人工智能领域首席科学家、IEEEFELLOW田奇博士,发表了“云原生时代,视觉预训练大模型探索与实践”的主题演讲,介绍了云原生时代华为云在AI基础研究、视觉预训练模
天翼云4.0首亮相!
11月11日,以“云网融合数智相生”为主题的2021天翼智能生态博览会在广州顺利开幕。作为全球三大顶级智能(通信)展之一的行业权威展会,天翼智能生态博览会历经十二年发展,如今已成为引领全球智能生态发展的极具风向标意义的国际化平台,是中国电信一张重要的行业名片。在同期举办的天翼智能生态高峰论坛现场,中国电信集团有限公司党组副书记邵广禄发布了天翼云4.0分布式
一不小心晋级“CCF国际AIOps挑战赛”决赛
近期,由天翼云研发二部云终端基础平台团队组成的“翼起飞”战队,在2022CCF国际AIOps挑战赛中,以第三名的成绩强势晋级决赛,并将于8月13日参加最终的决赛答辩,作为唯一一支进入决赛的运营商队伍,此次晋级意味着天翼云的智能运维能力已处于业内领先水平。国际AIOps挑战赛由清华大学联合中国计算机学会(CCF)共同发起,是智能运维领域的国际顶尖赛事,备受全
恭喜天翼云“翼起飞”战队在CCF国际AIOps挑战赛中夺得亚军
近日,2022CCF国际AIOps挑战赛在北京圆满落幕,由天翼云研发二部云终端基础平台团队组成的“翼起飞”战队以优越的成绩斩获本次挑战赛决赛亚军。此次赛题设计源于AIOps的核心场景——故障快速发现与诊断,比赛数据基于微服务架构的模拟电商系统,要求参赛选手在云环境下完成算法模型调优、线上评测等操作。历经紧张激烈的角逐和层层选拔,全球百支参赛队伍中仅有9支队
京东云开发者 京东云开发者
10个月前
2023京东全球科技探索者大会暨京东云峰会来了!
大模型开启AI新范式,AIGC掀起行业新浪潮。“2023京东全球科技探索者大会暨京东云峰会”,将于7月13日在北京举办。本次大会,以“跨越·产业智能”为主题,聚焦大模型与产业深度融合,将重磅发布京东大模型,推出新一代数字基础设施,升级产品及解决方案,致力于
天翼云,出海!
作为全球最大的运营商云,天翼云于2023年6月16日在香港成功举办 “天翼云全球发布会”,正式宣布以香港为首站,全面进军国际市场。
大语言模型微调数据竞赛,冠军!
近日,天池FTDataRanker竞赛落下帷幕,天翼云智能边缘事业部AI团队(后称天翼云AI团队)凭借在大语言模型(LLM)训练数据增强方面的卓越研究,荣获大语言模型微调数据竞赛——7B模型赛道冠军。
数字先锋 | “言”之有“力”,大模型背后的算力“推手”!
在算力调度方面,天翼云通过自研的调度系统,协助思必驰DFM2大模型调度GPU、NPU、CPU等异构算力资源,大规模训练上云1个月,可以完成数十亿规模大模型所有阶段训练和效果评估。在训练能力打造方面,天翼云支持多种模型训练方式,不仅可以提升大模型训练平台的数据量,还大幅缩短了训练周期和交付进度。
第一!天翼云荣获国际人工智能顶会AAAI 2024大模型数学理解&推理竞赛冠军!
近日,AAAI2024GlobalCompetitiononMathProblemSolvingandReasoning大赛落下帷幕,天翼云智能边缘事业部AI团队凭借在大模型基础能力研究领域的数据处理与模型训练策略的领先优势,在众多参赛队伍中脱颖而出,荣获本次竞赛冠军。
韦康 韦康
1个月前
AI大模型系统实战|更新完
AI大模型系统实战|更新完download》itzcw.com/8556/一、什么是AI大模型系统AI大模型系统是指使用大规模的人工智能(AI)模型来解决复杂的问题或完成各种任务的系统。这些大模型系统通常是基于深度学习技术构建的,并且经过大规模、长时间的训
天翼云开发者社区
天翼云开发者社区
Lv1
天翼云是中国电信倾力打造的云服务品牌,致力于成为领先的云计算服务提供商。提供云主机、CDN、云电脑、大数据及AI等全线产品和场景化解决方案。
文章
494
粉丝
8
获赞
37