Karen110 Karen110
4年前
一文了解滴滴与蚂蚁金服开源共建的SQLFlow
「数仓宝贝库」,带你学数据!导读:SQFlow利用SQL语言构建机器学习和深度学习,致力于“MakeAIassimpleasSQL”,愿景是推进人工智能大众化、普及化,也就是只要懂商业逻辑就能用上人工智能,让懂业务的人能自由地使用人工智能。本文带你快速了解开源的工程化的自助式数据科学平台SQLFlow。SQLFlow利用SQL语言构建机器学习
HelloWorld官方 HelloWorld官方
5年前
C++概述
概述C是静态,可编译,通用,大小写敏感,格式自由的编程语言,它支持程序化,面向对象的,和泛型编程方式。C被看作是中间层语言,因为它同时包含了低级语言和高级语言的特性。C是于1979年在新泽西的茉莉山丘的贝尔实验室由BjarneStroustrup开发的,它是C语言的加强版,最开始它被称作“CwithClasses”,但是
Stella981 Stella981
4年前
Flink技术实战宝典.pdf
近年来,AI场景发展得如火如荼,同时其计算规模也越来越大。这也让专注于数据处理的Flink有了较大的发展空间。Flink作为在大数据生态里实时处理的一个新框架,在一定程度上也有一定的难度。!(https://oscimg.oschina.net/oscnet/88055ce26e954c86ac75a83feb1e391d.pn
Stella981 Stella981
4年前
DevOps简介
DevOps是一个完整的面向IT运维的工作流,以IT自动化以及持续集成(CI)、持续部署(CD)为基础,来优化程式开发、测试、系统运维等所有环节。DevOps的概念DevOps一词的来自于Development和Operations的组合,突出重视软件开发人员和运维人员的沟通合作,通过自动化流程来使得软件构建、测试、发布更加快捷、频繁和
Stella981 Stella981
4年前
BudWk 国产Java微服务分布式框架 V6 与 V5等版本的区别
BudWk(原名NutzWk)BudWk(原名NutzWk)发展自2010年,2012年开始用于商业项目,至今已服务于全国各地公司大大小小数千个项目,行业涉及政务、电商、物联网等,随着个人经验积累及从事行业的不同分别发布了1.x至6.x多个版本,您可以根据项目规模选择不同版本。本项目案例众多,省厅级项目、市级平台、大数据项
Wesley13 Wesley13
4年前
MySQL 部署分布式架构 MyCAT (五)
分片(水平拆分)4.全局表业务使用场景:如果你的业务中有些数据类似于数据字典,比如配置文件的配置,常用业务的配置或者数据量不大很少变动的表,这些表往往不是特别大,而且大部分的业务场景都会用到,那么这种表适合于Mycat全局表,无须对数据进行切分,要在所有的分片上保存一份数据即可
Wesley13 Wesley13
4年前
2018华为云区块链全球开发者大赛——小链接 大未来
!(https://oscimg.oschina.net/oscnet/1847f84cb39a51fe2043560768d16c0c842.jpg)金秋10月,由华为云和可信区块链推进计划联合主办的区块链全球开发者大赛于10月9日在北京盛大开幕!本次活动获得中国信息通信研究院和多家行业知名机构的大力支持,同时还邀请了国内外行业重量级专
Wesley13 Wesley13
4年前
MySQL分割一行为多行的思路
最近数据分析有需求,分析运营活动短信用户,但是发送短信的用户是通过JSON字符串数组存储在一个text字段的。内容类似于:"user1","user2","user3"....数据分析想分析这些用户,那么就需要in这些用户查询。自己手动拼SQL太蛋疼,而且好几万几十万的用户,拼成SQL,复制粘贴也够蛋疼的。那
小白学大数据 小白学大数据
2星期前
随机间隔在 Python 爬虫中的应用实践
一、随机间隔的核心应用价值在深入技术实现之前,我们首先需要明确:为什么随机间隔在爬虫开发中如此重要?1.打破请求规律性,规避反爬检测网站的反爬系统通常会通过分析请求日志,识别具有固定时间间隔(如每1秒发送1次请求)、高频次的请求流量。这类流量明显区别于人类
小白学大数据 小白学大数据
2星期前
随机间隔在 Python 爬虫中的应用实践
一、随机间隔的核心应用价值在深入技术实现之前,我们首先需要明确:为什么随机间隔在爬虫开发中如此重要?1.打破请求规律性,规避反爬检测网站的反爬系统通常会通过分析请求日志,识别具有固定时间间隔(如每1秒发送1次请求)、高频次的请求流量。这类流量明显区别于人类