数据业务学习笔记

BitRhapsodyMaster
• 阅读 82
  • 在数据分析中,经常被提到的词有数据、算法、模型、业务、技术等等。
  • 关于业务和数据的关系,其实他们并不像网络段子所说的相对立。而是相互依存,相互成就的关系。
  • 在整个业务流程中,技术只是其中的一环,想要把整个业务做成、必然会有一套复杂的过程,技术只是一种工具和实现落地的方式。
  • 在数据分析的部分,评价数据分析好坏的方式就是通过各种指标是否达成来看。(付费率、留存率、首充率、达成率、日均流水等等)
  • 对于业务而言,很多时候是复杂而多元的。
  • 对于技术人员而言,理解了技术的最终目的是服务于业务,让整个事儿办成。那么就不能太拘泥于技术之美、最佳实现。只要把事情做成是可以有所取舍的。
  • 在整个业务流程中,产品经理扮演者很重要的角色。他既要沟通好业务方,也要拆分需求和技术方合作,最终把事情做成。
  • 数据分析师虽然会用一些技术工具,但整体而言还是属于业务侧的。他们需要掌握的基础知识有数学、概率学、统计学等等……他们会用到的工具有 Python 脚本、Excel、SQL、大数据框架(Hadoop、Spark 等)

最后,是我作为数据相关前端工作的思考:我们在一个数据部门中属于是数据展现和交互层的角色,而整个部门的流程大概如下

需求方提出需求 - 数据分析师了解需求进行数据分析 - 数据后端通过各种工具进行数据计算 - 业务后端获取数据后端的各种计算结果组装成接口 - 业务前端通过产品设计和业务后端接口产出前端页面

所以,目前我所做的项目也就是:1. 数据分析工具 2. 数据结果展示 3. 相关支持系统。明显都是为了整个数据流程服务的。

而前端作为数据流水线的最终一环,需要做好的几点是:

  • 数据展现,首先必然是清晰明了、一目了然。其次也需要深入了解一些数据可视化的知识,从而更好的将数据展现给业务方。
  • 界面交互友好,保证基本交互正常的前提下,多为用户提供一些便捷功能。
  • 保证高性能,由于数据分析体量大的特征,后端需要做好查询数据速度的提升,前端也要避免渲染大量 DOM 元素的情况,这会导致页面假死、卡顿、崩溃。采用一些虚拟列表、按需加载、分页、Canvas 绘制可以有效提升这方面的性能。

这么一想,其实很多之前被我忽略的细节交互其实挺重要的,而我所看重的代码解耦、技术方案其实在业务侧看来好像并不会太在意。以后要学会多转换视角理解业务方真正的需求才是。

点赞
收藏
评论区
推荐文章
Irene181 Irene181
4年前
手把手教你用pandas处理缺失值
导读:在进行数据分析和建模的过程中,大量的时间花在数据准备上:加载、清理、转换和重新排列。本文将讨论用于缺失值处理的工具。缺失数据会在很多数据分析应用中出现。pandas的目标之一就是尽可能无痛地处理缺失值。作者:韦斯·麦金尼(WesMcKinney)译者:徐敬一来源:大数据DT(ID:hzdashuju)pandas对象的所有描述
Irene181 Irene181
4年前
手把手教你用pandas处理缺失值
导读:在进行数据分析和建模的过程中,大量的时间花在数据准备上:加载、清理、转换和重新排列。本文将讨论用于缺失值处理的工具。缺失数据会在很多数据分析应用中出现。pandas的目标之一就是尽可能无痛地处理缺失值。作者:韦斯·麦金尼(WesMcKinney)译者:徐敬一来源:大数据DT(ID:hzdashuju)pandas对象的所有描述
DevOpSec DevOpSec
4年前
运维,关于监控的那些事,你有必要了解一下
作者|乔克来源|运维开发故事监控是整个运维以及产品整个生命周期最重要的一环,它旨在事前能够及时预警发现故障,事中能够结合监控数据定位问题,事后能够提供数据用于分析问题。一、监控的目的监控贯穿应用的整个生命周期。即从程序设计、开发、部署、下线。其主要的服务对象有:技术业务技术通过监控系统可以了解技术的环
东方客主 东方客主
4年前
PHP实现文本快速查找 - 二分查找法
起因先说说事情的起因,最近在分析数据时经常遇到一种场景,代码需要频繁的读某一张数据库的表,比如根据地区ID获取地区名称、根据网站分类ID获取分类名称、根据关键词ID获取关键词等。虽然以上需求都可以在原始建表时,通过冗余数据来解决。但仍有部分业务存的只是关联表的ID,数据分析时需要频繁的查表。所读的表存在共同的特点数据几乎不会变更数据量适中,从一万
Aidan075 Aidan075
4年前
数据可视化 | 数据可视化的基本流程总结
↑关注星标  有趣的不像个技术号每晚九点,我们准时相约  我们要的不是数据,而是数据告诉我们的事实。大多数人面临这样一个挑战:我们认识到数据可视化的必要性,但缺乏数据可视化方面的专业技能。部分原因可以归结于,数据可视化只是数据分析过程中的一个环节,数据分析师可能将精力花在获取数据、清洗整理数据、分析数据、建立模型,但在最终的展示沟通
Stella981 Stella981
3年前
Spark如何与深度学习框架协作,处理非结构化数据
随着大数据和AI业务的不断融合,大数据分析和处理过程中,通过深度学习技术对非结构化数据(如图片、音频、文本)进行大数据处理的业务场景越来越多。本文会介绍Spark如何与深度学习框架进行协同工作,在大数据的处理过程利用深度学习框架对非结构化数据进行处理。Spark介绍Spark是大规模数据处理的事实标准,包括机器学习的操
Wesley13 Wesley13
3年前
LEAD函数在数据分析中的应用
点击上方SQL数据库开发,关注获取SQL视频教程SQL专栏SQL数据库基础知识汇总(https://www.oschina.net/action/GoToLink?urlhttps%3A%2F%2Fmp.weixin.qq.com%2Fs%3F__biz%3DMzA3MTg4NjY4Mw%3D%3D%26mid%3D2457300844
Wesley13 Wesley13
3年前
DTCC 年度最佳创新产品丨真正的 HTAP 数据库是怎样炼成的?
12月21日,在第十一届中国数据库技术大会(DTCC)2020数据风云奖评选活动中,PingCAPTiDB荣获2020年度最佳创新产品奖。同时,PingCAP数据库内核研发工程师韦万受邀在数据库内核专场进行了《使用TiDB列存引擎进行实时数据分析》的主题演讲。由PingCAP创立的分布式关系型数据库TiDB,为企业关键业务打造
GPT-4助力数据分析:提升效率与洞察力的未来关键技术 | 京东云技术团队
ChatGPT4作为一种先进的自然语言处理技术,为数据分析带来了革命性的提升,助力企业和组织更高效地挖掘数据价值。本文将探讨ChatGPT4在数据分析中的应用,以及如何通过该技术提高数据分析的效率和洞察力。
达达埋点迁移京东子午线实践 | 京东云技术团队
一、概述1.项目价值及成果使用集团的统一埋点采集能力和埋点平台,完成达达7条业务线共43个站点应用的埋点迁移,降低自研采集工具和平台的研发投入和机器成本,打通数据链路,创造更多的数据分析价值。具体降本增效价值如下:1.1数据分析价值:与京东流量数据打通,拉