CSDN Meetup 回顾 丨从数据湖到指标中台,提升数据分析 ROI

多态根系
• 阅读 474

近日,Kyligence 合伙人兼副总裁李栋受邀出席 CSDN 云原生系列在线峰会。在第 13 期 “ 现代数据栈峰会 ”上,李栋从指标中台的趋势和背景出发,围绕指标中台的真实案例,对 Kyligence 实现指标中台的过程及提升数据分析 ROI 的经验进行了详细分享。

1. 什么是“指标中台”

指标是衡量事物的标准,数据分析的关键就是找到正确指标并获得洞察,并开展经营决策。指标中台(Metrics Store)是当下流行的技术之一。

在传统的数据分析场景中,往往会把数据统一接入到一个数据平台,例如数据湖、数据仓库等技术。通过一系列 ETL 开发后,将数据对接到下游的 BI 或自研的数据应用,数据分析师或业务用户通过查看报表和数据应用来查看指标数据,并对指标进行洞察分析和开展业务决策。

这种情况下,所有业务指标分散存储在各个 BI 报表或应用系统当中,当指标数、用户数越来越多时,数据管理和指标管理会产生很大的混乱。例如指标在不同报表中出现同义不同名、同名不同义、数据口径不一致、时间对不齐等难题,极大降低了业务用户对数据的信心。

 CSDN Meetup 回顾 丨从数据湖到指标中台,提升数据分析 ROI

指标中台的出现,旨在通过一个平台统一管理所有业务指标,以及指标背后的数据。指标中台不仅可以解决前面提到的技术挑战,赋能业务人员更自助、更有信心地使用数据,还能帮助 IT 团队创造更高业务价值。

2. 影响数据分析 ROI 的障碍

国内某一线互联网企业,早年开始数字化建设,并搭建了数据湖来汇总存储各个来源的数据。按照传统的方式,所有的源表(ODS表)落到数据湖上后,业务用户无法直接使用这些源表,需要经过 ETL 开发宽表和聚合表才能被下游业务使用。

 CSDN Meetup 回顾 丨从数据湖到指标中台,提升数据分析 ROI

这就带来了两方面的问题:

  • 宽表爆炸:最初仅有 5.7 k 张 ODS 表,却膨胀至近百万张宽表和聚合表,给数据存储和数据管理带来极大负担;此外,每个宽表都需要 ETL 开发和管理工作,对计算资源和管理复杂度也是很大挑战;
  • 难以使用:这么多的宽表和数据表,用户在使用时很难快速定位需要分析的指标存在哪张表上,数据使用的效率很低。

由此可见,影响数据分析 ROI 的障碍主要是:

  • 指标口径不一致:数据量很大,但缺少信任;
  • “浑浊”的数据湖——宽表爆炸,数据存储和ETL任务冗余;
  • IT 成本&时效性—— IT 成本和开发效率随数据量和用户量增长而难以控制。

3. 通过指标中台解决上述挑战

传统在数据湖中加工和分析指标的方式,是经过 ETL 为每个指标开发宽表和聚合表(如下图所示)。虽然很多指标背后的数据是可以复用的,但因为需求来自不同业务部门,缺少数据共享,最终只能重复开发,生成大量冗余的宽表和聚合表。

  •  CSDN Meetup 回顾 丨从数据湖到指标中台,提升数据分析 ROI

使用指标中台后,所有的数据指标被统一管理,并形成指标体系,如基础指标、衍生指标等。如果不同的指标背后对应的数据模型是同一个,那么指标的加工和计算过程是可以复用的。如果是同一份数据按不同口径服务不同业务,则通过衍生指标灵活响应业务需求,既能满足业务多变的需求,又能避免数据冗余导致的宽表爆炸。

 CSDN Meetup 回顾 丨从数据湖到指标中台,提升数据分析 ROI

由此可见,在指标中台里“指标”成为数据和业务交互的主体,通过对“指标”的标准化,形成数据开发和管理的标准化。

 CSDN Meetup 回顾 丨从数据湖到指标中台,提升数据分析 ROI

下图展示的是某银行企业使用指标中台前的状况。银行业务人员需要对用户的消费行为进行分析,从交付指标到获得相关数据,通常需要 12 个工作日甚至更长时间。数据开发效率低、需求交付周期极长。

 CSDN Meetup 回顾 丨从数据湖到指标中台,提升数据分析 ROI

我们来看看该银行使用指标中台后的情况。如下图所示,指标中台允许非技术人员自助管理衍生指标,并通过拖拽现成指标的方式创建仪表板,端到端交付时间减少 50%,从需求到开发,流程轻松省时、企业人效大幅提升。

 CSDN Meetup 回顾 丨从数据湖到指标中台,提升数据分析 ROI

4. 指标中台的能力

 CSDN Meetup 回顾 丨从数据湖到指标中台,提升数据分析 ROI

从技术角度来讲,指标中台的能力主要展现在四个方面。

  • 指标目录:统一管理所有业务指标口径从数据湖的表开始定义指标,包括基础指标和衍生指标,并将所有指标管理在一个平台中,实现业务指标的统一管理。
  • 指标自动化:以指标管理数据,消除宽表操作根据指标定义的逻辑对底层数据进行加工、预计算,并根据指标所在的数据模型进行合并,消除宽表爆炸。若是指标很少被访问或是不再被访问,可以自动清理指标数据的预计算结果。此外,系统也会智能地向用户推荐常用的或关联度高的指标,提升找指标的效率。
  • 目标管理:用目标管理指标,形成指标体系管理指标的目的是帮助企业实现业务目标管理的目的,因此通过管理目标的方式管理指标,形成指标体系,可帮助企业更好地达成目标。
  • API 集成:构建数据应用,一致消费指标数据当指标和目标完成定义,系统需要一个出口。通过标准的指标 API ,让用户轻松构建数据应用,为应用提供一致的数据来源,消除指标割裂和数据孤岛。

5. Kyligence 指标中台产品实践

Kyligence 基于指标中台实践经验和 OLAP 基础能力,上线了智能指标驱动的管理和决策平台 Kyligence Zen。在本次演讲中,李栋以零售订单分析场景为例,演示了该产品的主要功能。

 CSDN Meetup 回顾 丨从数据湖到指标中台,提升数据分析 ROI

导入数据

只需把订单数据上传到 S3 ,并输入 S3 链接地址,就可以快速把数据接入到指标中台。

 CSDN Meetup 回顾 丨从数据湖到指标中台,提升数据分析 ROI

导入指标

通过 YAML 文件定义好销量和利润等零售业务指标,即可一键导入。通过这种方式,可以轻松地把业务指标从 BI 平台批量接入指标中台。

 CSDN Meetup 回顾 丨从数据湖到指标中台,提升数据分析 ROI

管理指标

所有指标以卡片的方式被统一管理。对于零售企业,无论是集团管理人员还是门店店长,看到的都是同一套指标,以及同一套数据。

 CSDN Meetup 回顾 丨从数据湖到指标中台,提升数据分析 ROI

管理目标

为了更好地使用指标支持业务决策,可以创建目标来管理指标,从业务角度管理指标体系。

 CSDN Meetup 回顾 丨从数据湖到指标中台,提升数据分析 ROI

指标可视化

所有指标还可以灵活地制作可视化仪表盘,方便业务人员自助查看指标和进行归因分析。除此之外,指标也可以通过 API 对接其他数据应用。

6. 总结

指标中台可有效解决数据湖上数据分析效率低下的问题,从而将 IT 团队从重复的报表开发工作中释放出来,投入到业务指标体系的管理和持续运营之中,并创造更多业务价值,大大提升企业的人效。

关于 Kyligence

上海跬智信息技术有限公司 (Kyligence) 由 Apache Kylin 创始团队于 2016 年创办,致力于打造下一代企业级智能多维数据库,为企业简化数据湖上的多维数据分析(OLAP)。通过 AI 增强的高性能分析引擎、统一 SQL 服务接口、业务语义层等功能,Kyligence 提供成本最优的多维数据分析能力,支撑企业商务智能(BI)分析、灵活查询和互联网级数据服务等多类应用场景,助力企业构建更可靠的指标体系,释放业务自助分析潜力。

Kyligence 已服务中国、美国、欧洲及亚太的多个银行、证券、保险、制造、零售等行业客户,包括建设银行、浦发银行、招商银行、平安银行、宁波银行、太平洋保险、中国银联、上汽、Costa、UBS、MetLife 等全球知名企业,并和微软、亚马逊、华为、Tableau 等技术领导者达成全球合作伙伴关系。目前公司已经在上海、北京、深圳、厦门、武汉及美国的硅谷、纽约、西雅图等开设分公司或办事机构。

点赞
收藏
评论区
推荐文章
Aidan075 Aidan075
4年前
数据分析面试-业务分析篇
一.指标建模1.1互联网产品常用指标1.2选好数据指标的通用方法论三部曲1.从业务的最终目的出发梳理业务模块拆解:多问几个how目的:我要卖货手段:通过图文来买货支撑手段的手段:通过社区创作的优美的图文来卖货2.判断业务模块所属类型业务类型二.数据分析方法论2.1对比分析绝对值(本身具备价值的数字)eg:销售金融阅读数比例值(在具体环境中看
zookeeper的Leader选举源码解析
应用健康度是反馈应用健康程度的指标,它将系统指标分类为基础资源、容器、应用、报警配置、链路这几项,收集了一系列系统应用的指标,并对指标进行打分。知其然需知其所以然,了解应用健康度中的指标背后的隐患,对于我们了解和提升系统安全性很有帮助。
Wesley13 Wesley13
3年前
2019年北航OO第1单元(表达式求导)总结
2019年北航OO第1单元(表达式求导)总结1基于度量的程序结构分析量化指标及分析以下是三次作业的量化指标统计:!(https://img2018.cnblogs.com/blog/1616496/201903/1616496201903251247313
速看亚马逊云科技峰会,见甄借力“AI+云”开辟老酒行业新赛道
9月9日,2021中国场正式开幕,采用“线上峰会”模式,全程在线直播。本次大会主题为“构建重塑云时代新格局”,聚焦“行业愿景、技术创新、开发者话题、人工智能”四大方向。作为专业的茅台酒收藏系统,“见真”受邀出席,并与众多业内领先的技术和理念从业者携手,围绕云计算的趋势洞察和技术创新,从多个维度解读和分享老酒新零售业务的发展。借助大数据、人工智能和云计算,不仅
Wesley13 Wesley13
3年前
5步实现数据指标增长,提升数据分析能力
!5步实现数据指标增长,提升数据分析能力(https://s4.51cto.com/images/blog/202009/15/081547a226ce35f8ee53d7e5675f38cb.png?xossprocessimage/watermark,size_16,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_10
Wesley13 Wesley13
3年前
APP数据分析,到底是在分析什么?
当下,逢运营必谈数据分析,APP运营更是如此。数据分析的用意本不在于数据本身,而是要打造一个数据反馈闭环。收集数据,设计基础数据指标,多维度交叉分析不同指标,以数据甄别问题,再反向作用产品,最终形成数据驱动产品设计的闭环。从运营小白到产品经理,提到APP数据分析,必谈DAU、MAU、留存率、频率、时长…..那么,究竟如何将这些数据分析和日常运营结合起来呢
数据中台应具备哪些功能?
数据中台对于大部分人来说,都是使用数据中台,如果让你来搭建一个数据中台,你知道应该搭建什么功能,才算是一个相对合格的数据中台吗?数据中台在普通开发者来说,感觉就是有很多功能,那么具体有哪些呢?就算是一名普通开发者,也应该知道数据中台具备哪些功能,里面的具体
天翼云数字政府智慧数据中台通过认证
6月13日,由中国信通院、中国通信标准化协会主办的“数字政府智创沙龙”在线上举办。天翼云凭借丰富的资源与实践经验,顺利通过信通院数字政府智慧中台评估。天翼云高级解决方案架构师黄帆发表题为“数字政府数据中台应用实践”的演讲,详细阐述数据中台在数字政府建设中的重要意义,以及天翼云在建设数字政府数据中台方面的经验成果及优势。近年来,在各地政府全面落实大数据战略进行
实践指南-前端性能提升 270% | 京东云技术团队
本文详细介绍了一个前端项目优化的详细过程,从优化前的问题分析,到具体的优化措施,最终实现了前端性能提升了近3倍。同时也将性能指标落到监控平台,实现可视化的监控前端性能指标。
黄金眼PAAS化数据服务DIFF测试工具的建设实践 | 京东云技术团队
一、背景介绍黄金眼PAAS化数据服务是一系列实现相同指标服务协议的数据服务,各个服务间按照所生产指标的主题作划分,比如交易实时服务提供实时交易指标的查询,财务离线服务提供离线财务指标的查询。黄金眼PAAS化数据服务支撑了黄金眼APP、黄金眼PC和内部各类大
云监控的核心:确保稳定性的关键监控指标
云监控是指对云服务进行实时监控,收集和分析各种运行数据,以便及时发现和解决潜在问题。云监控的目的是确保云服务的稳定性、可用性和性能。为了实现这一目标,需要选择一系列关键监控指标来全面反映云服务的运行状态。