云原生研发突破,国际顶会认可!

天翼云开发者社区
• 阅读 2

近日,由天翼云与中国电信云计算研究院联合完成的论文《gShare: Efficient GPU Sharing with Aggressive Scheduling in Multi-tenant FaaS platform》,获计算机系统领域国际顶级会议ASPLOS 2026长文收录。该研究面向AI智能应用场景,提出了一套针对GPU FaaS云函数的高效资源共享与调度机制,标志着天翼云在Serverless GPU的细粒度算力供给与多租户资源优化领域实现重要突破。

云原生研发突破,国际顶会认可!

ASPLOS(International Conference on Architectural Support for Programming Languages and Operating Systems)是国际计算机体系结构四大旗舰会议之一,获中国计算机学会(CCF)最高推荐级别A类认证,在全球学术界与产业界享有极高声誉。本届ASPLOS夏季评审轮次共收到840篇投稿,仅录用89篇,录取率低至10%,论文质量与创新性要求极为严苛。此次联合研究成果成功入选,彰显了中国电信天翼云在“AI+云”融合创新上的前瞻布局与自主攻坚能力。

gShare GPU动态共享技术,破解Serverless场景GPU供给难题

随着大语言模型、AI智能体等应用加速落地,算力需求正呈现“泛在化、动态化、碎片化”新特征。传统云计算GPU资源供给模型普遍存在资源分配粒度粗、弹性不足、租户成本高等痛点,难以适应中小模型推理、边缘智能等场景对高性价比、灵活弹性的GPU算力需求。

天翼云公有云事业部与基础架构事业部,携手中国电信云计算研究院,基于目前流行的Serverless函数式编程范式,共同开展了面向AI智能应用的高效GPU云函数课题研究,并基于自研evGPU技术研发出面向多租户的低成本GPU函数共享调度系统gShare。该系统以微虚拟机作为安全隔离环境与函数运行载体,通过三大核心技术创新实现GPU资源的“时空动态”高效利用

01基于vGPU的细粒度算力分配——精确匹配用户资源需求 该系统底层设计采用近乎零开销的自研虚拟化技术,实现对VM到物理GPU设备间任意粒度的算力切片供给,租户函数实例可根据自身业务实际消耗按需申请vGPU资源,彻底告别传统GPU整卡独占的粗放模式,降低资源浪费。

02基于超售的资源定价与调度策略——释放用户函数闲置算力 该系统资源创新性地采用了GPU与CPU和内存资源管理的解耦设计,通过vGPU热插拔和快速显存交换技术,允许函数到GPU切片间映射关系的运行时动态调整,同时结合deadline感知的延迟调度设计以实现资源超售。租户可根据需要选择不同共享粒度并享受相应价格折扣,从而实现闲置GPU算力的高效回收利用和成本-性能最优平衡

03跨资源池的统一调度与管理架构——支撑泛在智能业务场景 该系统可适配包括TensorFlow Serving, PyTorch, vLLM, and SGLang在内的主流AI推理框架,其设计也天然兼容跨异构资源池的统一调度与管理架构,除可部署在传统的数据中心集中式GPU资源池之外,还能够部署在分布广泛、具有零散和碎片化资源的边缘分布式算力节点,为构建中国电信“中心-边缘”协同的分层多级泛在算力供给体系提供核心技术支撑。

云原生研发突破,国际顶会认可! 基于vGPU重映射的动态共享GPU云函数设计

测试结果表明,gShare相关成果可显著提升Serverless平台内部的GPU资源利用率,降低企业采购与运营成本。同时,云租户可根据实际GPU共享力度享受对应的价格折扣,真正实现“用得省、用得好”。

目前,gShare相关研究成果已在天翼云函数计算产品中实现落地部署。依托中国电信的泛在云网基础设施与息壤算力互联调度平台,该技术可进一步拓展至边缘大模型推理、云游戏等边缘计算场景,实现从中心到边缘的全场景算力灵活供给。未来,天翼云将持续深化泛在算力与智能调度等领域的探索,通过提供无处不在、弹性高效、成本可控的AI算力,推动智能算力走向普惠,赋能各行业智能化转型。

[论文信息:Yanan Yang, Zhengxiong Jiang, Meiqi Zhu, Hongqiang Xu, Yujun Wang, Liang Li, Jiansong Zhang, Jie Wu. gShare: Efficient GPU Sharing with Aggressive Scheduling in Multi-tenant FaaS platform. International Conference on Architectural Support for Programming Languages and Operating Systems (ASPLOS) 2026. Pittsburgh, USA. (Accepted)]

点赞
收藏
评论区
推荐文章
Stella981 Stella981
4年前
DOIS 2019 DevOps国际峰会北京站来袭~
DevOps国际峰会是国内唯一的国际性DevOps技术峰会,由OSCAR 联盟指导、DevOps时代社区与高效运维社区联合主办,共邀全球80余名顶级专家畅谈DevOps体系与方法、过程与实践、工具与技术。会议召开时间:2019070508:00至2019070618:00结束会议召开地点:北京主办单位:DevOps
一不小心晋级“CCF国际AIOps挑战赛”决赛
近期,由天翼云研发二部云终端基础平台团队组成的“翼起飞”战队,在2022CCF国际AIOps挑战赛中,以第三名的成绩强势晋级决赛,并将于8月13日参加最终的决赛答辩,作为唯一一支进入决赛的运营商队伍,此次晋级意味着天翼云的智能运维能力已处于业内领先水平。国际AIOps挑战赛由清华大学联合中国计算机学会(CCF)共同发起,是智能运维领域的国际顶尖赛事,备受全
天翼云联合国际咨询机构IDC发布《中国医疗云建设与应用白皮书》
2月14日,中国电信天翼云“共铸国云红云行业思想汇——2023年医疗云洞察与行业能力分享”线上会议顺利举办。会上,联合国际咨询公司IDC正式发布《中国医疗云建设与应用白皮书》,全面洞察我国医疗云现状,为卫生管理部门和医疗机构建设安全、可靠的医疗云平台,提供
彰显科技硬实力!天翼云论文在国际顶刊JoCCASA发表!
近日,由天翼云科技有限公司云网产品事业部混合云团队完成的论文《MultivariateTimeSeriesCollaborativeCompressionforMonitoringSystemsinSecuringCloudbasedDigitalTwin》在云计算领域国际知名学术期刊JournalofCloudComputing:Advances,SystemsandApplications(JoCCASA)发表。
三项国际人工智能顶会大奖!拿下!
近日,国际人工智能顶会CVPR 2024举办的第6届自然场景情感行为分析挑战赛(6thWorkshopandCompetitiononAffectiveBehaviorAnalysisinthewild,简称ABAW)公布比赛结果,天翼云AI团队(CtyunAI)在情感识别任务中表现出色,斩获双赛道亚军、单个赛道季军,并受邀在CVPRABAW研讨会上作论文分享。这是继天翼云在CVPR中荣获多次佳绩后再一次斩获殊荣。
国际“论”剑!天翼云数据库论文被EDBT收录!
近日,由天翼云数据库团队、中国电信云计算研究院和深圳北理莫斯科大学合作完成的《Taste:TowardsPracticalDeepLearningbasedApproachesforSemanticTypeDetectionintheCloud》(构建云上基于深度学习的大规模语义类型识别系统)论文被28thInternationalConferenceonExtendingDatabaseTechnology(EDBT)长文收录。
智 算 云 领 导 者 !
近日,由全球数字经济大会组委会主办,中国信息通信研究院(以下简称“中国信通院”)、中国通信企业协会承办的2024全球数字经济大会云·AI·计算国际合作论坛在北京成功召开。会上,中国信通院联合沙利文(Frost&Sullivan)发布《智算云生态影响力矩阵》,天翼云在技术能力、市场能力和战略布局三大维度全面领先,获评全量领导者,领跑智算云市场。
权威认可!天翼云强势入选IDC中国CNAPP领导者象限!
近日,国际权威咨询机构IDC发布《IDCMarketScape:中国CNAPP2025年厂商评估》报告,中国电信天翼云凭借云原生应用保护平台(CNAPP)的卓越技术实力和全场景安全能力,强势入选“领导者”象限,标志着天翼云在云原生安全领域的综合竞争力已处于
攻克大模型训练网络瓶颈,天翼云论文获ACM ICS顶会收录!
近日,由天翼云公有云事业部联合基础架构事业部所撰写的论文《CTCCL:CostEfficientJointDeviceNetworkLoadBalancingforLLMTraininginRoCEbasedIntelligentComputingNetw
智算领航,荣誉+1!
近日,国际数据公司IDC发布《IDCMarketScape:中国混合云AI智算平台2025年厂商评估》报告,从战略和能力维度对云服务商进行了综合评估。报告显示,中国电信天翼云在该评估中位列领导者类别,充分彰显了天翼云作为云服务国家队在混合云AI智算领域的核
天翼云开发者社区
天翼云开发者社区
Lv1
天翼云是中国电信倾力打造的云服务品牌,致力于成为领先的云计算服务提供商。提供云主机、CDN、云电脑、大数据及AI等全线产品和场景化解决方案。
文章
999
粉丝
16
获赞
40