数据分析的理解

元胞露台
• 阅读 492

前言

这是我对现在遇到的一些专有名词的理解

维度,指标

维度
可以从某一个角度分析一个结果,比如,今天的注册人数,这个今天就可以理解成维度。
也可以这样理解,不用通过操作,比如加减乘除平均,这些需要操作的,都当作维度。

举个栗子
数据分析的理解

指标
跟上面的反过来,一般需要加减乘除平均,这类的操作才能得出的结果,什么,注册人数,订单量,互动量,声量,份额,留存率,这些能简单看出来就是要计算的

举个栗子
数据分析的理解
等等等等,没有全部圈出来

码表

数据分析的理解
我自己理解哈,码表应该是提供关键词命中网上抓取到的符合录入条件的同时,再修饰一下,然后入库,比如哈
标题xxxxx在小红书的关注度超过xxxx
内容大家好我是xxx,感谢大家巴拉巴拉,在斗鱼充值的时候,巴拉巴拉

根据我的图,关键词小红书命中,所以这条数据要抓,然后出现过滤词斗鱼充值,再入库的时候把这个过滤掉,然后码表前面有A业务线,小红书,那么最终入库的时候,数据是

业务 品牌 标题 内容
A业务线 小红书 xxxxx在小红书的关注度超过xxxx 大家好我是xxx,感谢大家巴拉巴拉,在的时候,巴拉巴拉

这样看又好像不对,过滤词如果真的这样操作元数据后感觉前后文都不通,那么我猜应该是这样,关键词命中是第一步,然后再判断有没有出现过滤词,如果有,说明是无效数据,不抓,如果没有,则抓入库
以上是理解,总结,码表是客户提供的,客户告诉我们,他们想要我们抓什么样子的数据。有了这一步,才有下一步的分析

点赞
收藏
评论区
推荐文章
个推TechDay直播回顾 | 详解数据指标体系设计与开发全流程(附视频及课件下载)
科学完善的数据指标体系是企业开展数字化运营管理、打造数据驱动型组织的重要支撑。透过多维度的数据指标,运营人员能够清晰了解业务现状,产品/研发人员能够高效定位系统问题,管理人员能够更加准确地做出分析决策。那么,如何在充分理解业务需求的基础上,搭建出一
Aidan075 Aidan075
4年前
用python重温统计学基础:离散型概率分布
简单介绍数据的分布形态描述中的离散型概率分布利用python中的matplotlib来模拟几种分布的图形在上一篇中提到数据分析的对象主要是结构化化数据,而所有的结构化数据可以从三个维度进行描述,即数据的集中趋势描述,数据的离散程度描述和数据的分布形态描述,并对前两个维度进行了介绍。本篇主要是对数据的分布形态描述中的离散型概率分布进行介绍。
Wesley13 Wesley13
3年前
TIMER做免疫浸润分析(临床意义)
生信论文的套路1.ONCOMINE从全景、亚型两个维度做表达差异分析;2.临床标本从蛋白水平确认(或HPA数据库),很重要;3.KaplanMeierPlotter从临床意义的角度阐明其重要性;4.cBioportal数据库做基因组学的分析(机制一);5.STRING互作和
Wesley13 Wesley13
3年前
TIMER做差异分析散点图
生信论文的套路1.ONCOMINE从全景、亚型两个维度做表达差异分析;2.临床标本从蛋白水平确认(或HPA数据库),很重要;3.KaplanMeierPlotter从临床意义的角度阐明其重要性;4.cBioportal数据库做基因组学的分析(机制一);5.STRING互作和
Stella981 Stella981
3年前
KM plotter生存分析和相关性分析(临床意义)
生信论文的套路1.ONCOMINE从全景、亚型两个维度做表达差异分析;2.临床标本从蛋白水平确认(或HPA数据库),很重要;3.KaplanMeierPlotter从临床意义的角度阐明其重要性;4.cBioportal数据库做基因组学的分析(机制一);5.STRING互作和
Stella981 Stella981
3年前
KM plotter绘制生存曲线(临床意义)
生信论文的套路1.ONCOMINE从全景、亚型两个维度做表达差异分析;2.临床标本从蛋白水平确认(或HPA数据库),很重要;3.KaplanMeierPlotter从临床意义的角度阐明其重要性;4.cBioportal数据库做基因组学的分析(机制一);5.STRING互作和
Stella981 Stella981
3年前
Excel图表和数据分析
十年前写的,从今天看起来之前的想法还是比较幼稚的。从理论指导角度,数据分析可以划分为基于统计学的和基于数据挖掘的数据分析方法,很显然基于统计学的相对容易理解一些,而数据挖掘对高等数学要求会高一些,相信毕业十几年的同学很可能连A\X\\2B\XC0都快忘记了,甚至我不确定等小孩上了初中能不能教的了他数学。从分析的出发点看,数据分析
Wesley13 Wesley13
3年前
APP数据分析,到底是在分析什么?
当下,逢运营必谈数据分析,APP运营更是如此。数据分析的用意本不在于数据本身,而是要打造一个数据反馈闭环。收集数据,设计基础数据指标,多维度交叉分析不同指标,以数据甄别问题,再反向作用产品,最终形成数据驱动产品设计的闭环。从运营小白到产品经理,提到APP数据分析,必谈DAU、MAU、留存率、频率、时长…..那么,究竟如何将这些数据分析和日常运营结合起来呢
画像系统人群服务数据存储架构的演进与创新| 京东云技术团队
一、画像系统命中接口相关简介什么是画像系统标签画像系统是一种数据管理和分析工具,它通过整合和分析用户的行为数据、交易数据、社交数据等多维度信息,构建出用户的详细画像,帮助咱们运营人员更好地理解目标用户群体,从而实现精准营销和精细化运营。提供了那些能力:标签
研发提效:想快速定制一个OLAP应用?你可以这么做
一、背景在日常项目中,经常能遇到多维度、多指标自由组合分析的OLAP系统建设场景,这类需求往往具有分析关系复杂、开发周期长和数据量大等特点,需要研发投入比较大的精力进行建设。针对OLAP的场景,目前开源界大部分项目都是针对存储层的实现,如ClickHous