什么是标签?跟数据中台有什么关系?终于有人讲明白了

Karen110
• 阅读 1575

作者:任寅姿 季乐乐 来源:大数据DT(ID:hzdashuju)

什么是标签?跟数据中台有什么关系?终于有人讲明白了

01 什么是标签

标签指从原数据加工而来,能够直接为业务所用并产生业务价值的数据载体。 从本质上讲,标签本身也是一种数据(或映射指向数据),它是对物理层数据信息项的业务化封装,是数据资产的一种良好组织形式,是一种概念、逻辑定义,因此标签必须是可阅读、易理解的。

从粒度上来讲,标签往往映射为某一对象的属性,包括固有属性和动态属性,一般都需要结构化到字段粒度,保障可被后续数据服务便捷使用。它面向数据应用的业务端,核心解答的是数据怎么用、资产价值在哪里的问题。根据加工方式的不同,标签可以分成基础类标签、统计类标签和算法类标签。

02 什么是数据中台

伴随着云计算、大数据、人工智能等技术的快速发展,企业数字化、智能化转型步伐逐渐加快。

数据中台是2018年逐渐兴起的数据概念,核心要义在于增援未来,以发展的眼光解决企业未来可能面临的各种场景问题。面对不确定的未来,企业需要组织沉淀可复用的标签资产,加强数据服务能力,构建出自己的数据中台,才能符合数字化转型的时代要求。

定义角度看,数据中台是一套可持续“让企业数据用起来”的机制,是一种战略选择和组织形式,是依据企业特有的业务模式和组织架构,以有形的产品和实施方法论为支撑,构建的一套持续不断把数据变成资产并服务于业务的机制。

架构角度看,数据中台上承业务数据积累,通过自己的数据平台工具,将原始数据加工成数据资产,并通过数据资产服务化下启数据应用场景,帮助业务端或管理端降本增效。数据中台不只是一套生产加工的流程,它对企业的战略定位、组织保障、基础设施等方面都产生了深远的影响,如图2-14所示。

什么是标签?跟数据中台有什么关系?终于有人讲明白了

▲图2-14 数据中台架构图

实施角度看,数据中台是以数据资产为核心,以实现数据资产可见、可懂、可用、可运营的系列目标为出发点,配以平台工具、流程规范、应用建设等必要环节,最终落地的数据解决方案,如图2-15所示。

什么是标签?跟数据中台有什么关系?终于有人讲明白了

▲图2-15 以数据资产为核心的实施配套

03 标签在其中的重要位置

将企业的完整技术架构图抽丝剥茧,可以看到“标签”在数据中台中的具体位置:数据中台位于云底座与上层业务应用之间,即位于稳定厚重的技术大后台与灵活多变的业务小前台之间。 通过数据中台对底层复杂技术能力的抽象封装,前端业务可以自由、轻便地使用数据能力,弥合前后端步伐不一致的问题。

在数据中台内部,具体又细分出开发工具层、数据资产层、资产管理层、数据服务层、数据运营体系、数据安全体系等模块,如图2-16所示。

什么是标签?跟数据中台有什么关系?终于有人讲明白了

▲图2-16 标签在数据中台中的位置

原始汇入的数据通过开发工具层转变为企业自有的数据资产;在资产管理层对数据资产进行不断的治理优化;最终通过资产服务化将数据资产输送到业务各端,实现数据价值;统一的运营体系和标准安全管理主要从流程机制层面保障整个数据中台的平稳有序运行。

在数据中台中,开发或管理工具是可以直接采购的,运营体系和标准安全规范的方法论是可以学习的,但是数据资产和数据服务必须是企业自行建设和实施的结果,它们是数据中台的核心部分,没有捷径可走。

数据资产和数据服务中最核心的是标签:数据资产本身以标签为组织载体,而数据服务本质上是一种将标签传递给业务端使用的价值管道。标签是数据中台价值链路中“核心的核心”。

关于作者: 任寅姿(花名:影姿),资深产品总监、数澜研究院院长拥有超过10年的数据产品经验,原阿里巴巴集团数据产品专家,曾负责集团消费者标签类目体系、DMP精准营销等系统的数据资产设计与实施。2016年加入数澜科技,负责管理公司产品团队,系统提升团队数据思维、数据资产设计能力及数据服务应用经验,是数据中台理论定义及体系构建的核心参与者。

季乐乐(花名:寒泉),政法行业资深专家、产品专家拥有超过6年的政法行业产品经验,原南京通达海区域负责人,专注于研究数字检务、智慧法院等领域。

本文摘编自《标签类目体系:面向业务的数据资产设计方法论》,经出版方授权发布。

什么是标签?跟数据中台有什么关系?终于有人讲明白了

延伸阅读《标签类目体系》

点击上图了解及购买

转载请联系微信:DoctorData

推荐语: 标签类目体系是数据中台理念落地的核心组成部分,是实现数据资产可复用、柔性组合使用、降低数据应用试错门槛的强力支撑。本书旨在培养资深的数据资产架构师及数据运营专家,以方法教育而非工具实施的方式助力企业建立自身的数据资产化能力,将数据能力最大限度地转化为商业价值。

**-----**------**-----**---**** 送书 **-----**--------**-----**-****

欢迎各位大佬点击链接加入群聊【helloworld开发者社区】:https://jq.qq.com/?_wv=1027&k=mBlk6nzX进群交流IT技术热点。

本文转自 https://mp.weixin.qq.com/s/e6ZqAewQIQfKZIw1NLscuQ,如有侵权,请联系删除。

点赞
收藏
评论区
推荐文章
blmius blmius
2年前
MySQL:[Err] 1292 - Incorrect datetime value: ‘0000-00-00 00:00:00‘ for column ‘CREATE_TIME‘ at row 1
文章目录问题用navicat导入数据时,报错:原因这是因为当前的MySQL不支持datetime为0的情况。解决修改sql\mode:sql\mode:SQLMode定义了MySQL应支持的SQL语法、数据校验等,这样可以更容易地在不同的环境中使用MySQL。全局s
Wesley13 Wesley13
2年前
java将前端的json数组字符串转换为列表
记录下在前端通过ajax提交了一个json数组的字符串,在后端如何转换为列表。前端数据转化与请求varcontracts{id:'1',name:'yanggb合同1'},{id:'2',name:'yanggb合同2'},{id:'3',name:'yang
Jacquelyn38 Jacquelyn38
2年前
2020年前端实用代码段,为你的工作保驾护航
有空的时候,自己总结了几个代码段,在开发中也经常使用,谢谢。1、使用解构获取json数据let jsonData  id: 1,status: "OK",data: 'a', 'b';let  id, status, data: number   jsonData;console.log(id, status, number )
皕杰报表之UUID
​在我们用皕杰报表工具设计填报报表时,如何在新增行里自动增加id呢?能新增整数排序id吗?目前可以在新增行里自动增加id,但只能用uuid函数增加UUID编码,不能新增整数排序id。uuid函数说明:获取一个UUID,可以在填报表中用来创建数据ID语法:uuid()或uuid(sep)参数说明:sep布尔值,生成的uuid中是否包含分隔符'',缺省为
Karen110 Karen110
2年前
什么是标签?跟数据中台有什么关系?终于有人讲明白了
作者:任寅姿季乐乐来源:大数据DT(ID:hzdashuju)01 什么是标签标签指从原数据加工而来,能够直接为业务所用并产生业务价值的数据载体。从本质上讲,标签本身也是一种数据(或映射指向数据),它是对物理层数据信息项的业务化封装,是数据资产的一种良好组织形式,是一种概念、逻辑定义,因此标签必须是可阅读、易理解的。从粒度上来讲,标签
Stella981 Stella981
2年前
KVM调整cpu和内存
一.修改kvm虚拟机的配置1、virsheditcentos7找到“memory”和“vcpu”标签,将<namecentos7</name<uuid2220a6d1a36a4fbb8523e078b3dfe795</uuid
Easter79 Easter79
2年前
Twitter的分布式自增ID算法snowflake (Java版)
概述分布式系统中,有一些需要使用全局唯一ID的场景,这种时候为了防止ID冲突可以使用36位的UUID,但是UUID有一些缺点,首先他相对比较长,另外UUID一般是无序的。有些时候我们希望能使用一种简单一些的ID,并且希望ID能够按照时间有序生成。而twitter的snowflake解决了这种需求,最初Twitter把存储系统从MySQL迁移
京东云开发者 京东云开发者
6个月前
Vitess全局唯一ID生成的实现方案 | 京东云技术团队
为了标识一段数据,通常我们会为其指定一个唯一id,比如利用MySQL数据库中的自增主键。但是当数据量非常大时,仅靠数据库的自增主键是远远不够的,并且对于分布式数据库只依赖MySQL的自增id无法满足全局唯一的需求。因此,产生了多种解决方案,如UUID,Sn
京东云开发者 京东云开发者
3个月前
CDP技术系列(一):使用bitmap存储数十亿用户ID的标签或群体
一、背景介绍CDP系统中目前存在大量由用户ID集合组成的标签和群体,截止当前已有几千标签,群体2W。大量的标签都是亿级别数据量以上,例如性别、职业、学历等均,甚至有群体中的ID数量达到了数十亿。并且随着用户ID池的不断增加,标签和群体本身包含的ID数
京东云开发者 京东云开发者
3个月前
CDP技术系列(二):ClickHouse+Bitmap实现海量数据标签及群体组合计算
一、背景介绍上一篇文章介绍了CDP中,面对单个标签或群体数十亿的数据如何存储我们都知道数据仓库的概念,它的里边存储了我们所有的数据,其中就包含了标签或群体所依赖的数据,但是这些数据并不能直接拿来使用,想要变成业务需要的标签或群体数据,还需要进行加工。数据工