开源星「001号」落地 OpenMLDB,欢迎登陆赢神秘大礼包!

智数星河客
• 阅读 659

导读:

今年 5 月 6 日,腾讯·腾源会社区联合 OpenMLDB 等在内的 80 余家开源社区、国内外开源基金会等,共同发起「开源摘星计划」。开展 3 月以来,我们累计为近百位优秀摘星贡献者,送出激励大礼包 300 余份;同时为 700 位的开源爱好者搭建了共同的交流乐园,帮助很多人完成了从开源萌新到「过来人」的成长、蜕变。

今天,「开源摘星计划」继续「001号」任务探索,船长登陆,希望能和 OpenMLDB 星挖掘新一批的优秀摘星者,共同将 OpenMLDB 星建设得更好🌍以下是船长发来的前线信号……

Hi,各位开源爱好者,大家好!

我是「开源摘星号」飞船船长小源

很高兴今日降落 OpenMLDB 星

执行「开源星球」001 号任务

在 OpenMLDB 星上

我投递了无数的能量块

幸运的你只要从今日开始收集

下面这些特殊能量块

就有机会获得我在 8 月为你准备的登陆礼包

(证书、贡献卡、鹅厂周边、盛典入场券……)

完整参与攻略欢迎查看

OpenMLDB 星「能量块介绍」

OpenMLDB 是一个开源机器学习数据库,提供生产级数据及特征开发全栈 FeatureOps 解决方案。自开源以来,Open以开源的特征数据治理能力、SQL开发能力,提供全栈功能的、低门槛特征数据计算和管理平台,面向闭环解决 AI 工程化落地的数据治理难题,帮助企业做到低成本高效率地解决问题,已经在上百个企业级人工智能场景中得到落地,也得到了众多开发者的关注和支持。

项目仓库: https://github.com/4paradigm/...

能量块 1:基于 OpenMLDB 搭建使用案例

详细说明:OpenMLDB 主要为机器学习提供一个特征平台,同时也提供一个高性能的时序数据库。我们期望社区可以基于 OpenMLDB,贡献更多的使用案例。

难度:50 积分

任务详情:https://github.com/4paradigm/...

能量块 2:为监控模块 Prometheus 的 exporter 添加单元测试用例和覆盖度报告

详细说明:OpenMLDB exporter 模块 (https://github.com/4paradigm/...) 是 OpenMLDB 连接监控平台 Prometheus 的 exporter,它的角色是作为一个 OpenMLDB 的 client 接入,通过 OpenMLDB Python SDK 做 SQL 语句查询,并将查询结果转化成 prometheus 指标。目前该模块并没有添加单元测试用例,也没有覆盖度报告,你需要为该模块添加上述两项内容。

难度: 50 积分

任务详情https://github.com/4paradigm/...

能量块 3:OpenMLDB 离线增加 WindowColumnPruning 优化开关

详细说明:OpenMLDB 离线目前支持多种性能优化,包括窗口并行优化、窗口倾斜优化、UnsafeRow 内存优化等等。其中窗口并行优化里面还有一种优化,我们称之 为WindowColumnPruning(窗口列剪枝)优化,其原理是一个窗口计算除了新增的列,输入行的所有列都需要参与 Window 函数计算并直接返回到结果行中,如果开启 WindowColumnPruning 则 Window 计算只需要输出新增的列,输入的原始列可以和输出的新增列进行拼接。这个优化具体实现代码已经在窗口并行优化逻辑中实现,本次任务只是需要在 Java/Scala 侧新增开关,可以把是否开启该优化的功能暴露出去。

难度:50 积分

任务详情: https://github.com/4paradigm/...

能量块 4:ShowJobs 命令支持对返回结果进行倒序排序

详细说明:OpenMLDB 的“SHOW JOBS”命令可以返回所有的 Job 信息列表,返回的结果是从内部数据库中查询结果,目前的返回结果为乱序。在这个任务中,你需要修改代码,保证“SHOW JOBS”命令返回的结果是倒序排序,也就是以 Job ID 为排序列从大到小排序。

难度:50 积分

任务详情: https://github.com/4paradigm/...

能量块 5:磁盘表 disk table 支持添加/删除索引功能

详细说明:目前磁盘表 disk table 不支持添加或者删除索引功能,需要添加上 AddIndex 和DeleteIndex 功能,以便用户对磁盘表也可以进行索引的添加和删除。

难度:50 积分

任务详情:https://github.com/4paradigm/...

能量块 6:支持聚合函数STDDEV

详细说明:OpenMLDB 尚未支持内置的标准差聚合函数 STDDEV,在这个任务中,你将参照我们的内置聚合函数开发流程,实现一个 STDDEV 的聚合函数。

标准差 STDDEV 定义:https://en.wikipedia.org/wiki...

内置聚合函数的开发流程https://openmldb.ai/docs/zh/m...

难度:50 积分

任务详情:https://github.com/4paradigm/...

能量块 7:扩容后数据库分片迁移工具

详细说明:目前 OpenMLDB 在扩缩容以后,需要执行一系列的命令,来进行手动的数据分片迁移。其过程相当繁琐,并且容易出错。相关操作的文档见:https://openmldb.ai/docs/zh/m... 。在本任务中,你将会设计更加友好的独立数据库分片迁移工具,实现一键的手动或者自动化分片迁移。

难度:50 积分

任务详情:https://github.com/4paradigm/...

能量块 8:API Server 支持 Parameterized Queries

详细说明:OpenMLDB 的 apiserver 对 query 的支持有限,仅支持执行命令,返回执行状态,不能获得 query 结果,不支持 parameterized queries。在这个任务中,你将参考 apiserver 其他接口与 client(SQLRouter)的 query API ExecuteSQLParameterized,实现 apiserver 的 parameterized queries 接口,以及查询结果数据的返回。

难度:50 积分

任务详情:https://github.com/4paradigm/...

请感兴趣认领以上「能量块」的小伙伴,复制链接打开后,在 Comment 区评论 [WeOpen Star] I would like to help,代表认领任务成功。任务有限,先到先得!

集齐「能量块」能获得什么

开源星「001号」落地 OpenMLDB,欢迎登陆赢神秘大礼包!

报名开源摘星计划

对「开源摘星计划」感兴趣的小伙伴,可以通过以下链接深入了解开源摘星活动~

活动官网:https://cloud.tencent.com/act...

活动仓库:https://github.com/weopenproj...

写在最后

如果想进一步了解 OpenMLDB 或者参与社区技术交流,可以通过以下渠道获得相关信息和互动~

Github: https://github.com/4paradigm/...

Email: contact@openmldb.ai

OpenMLDB 微信交流群:

开源星「001号」落地 OpenMLDB,欢迎登陆赢神秘大礼包!

点赞
收藏
评论区
推荐文章
blmius blmius
4年前
MySQL:[Err] 1292 - Incorrect datetime value: ‘0000-00-00 00:00:00‘ for column ‘CREATE_TIME‘ at row 1
文章目录问题用navicat导入数据时,报错:原因这是因为当前的MySQL不支持datetime为0的情况。解决修改sql\mode:sql\mode:SQLMode定义了MySQL应支持的SQL语法、数据校验等,这样可以更容易地在不同的环境中使用MySQL。全局s
Wesley13 Wesley13
3年前
MySQL部分从库上面因为大量的临时表tmp_table造成慢查询
背景描述Time:20190124T00:08:14.70572408:00User@Host:@Id:Schema:sentrymetaLast_errno:0Killed:0Query_time:0.315758Lock_
美凌格栋栋酱 美凌格栋栋酱
7个月前
Oracle 分组与拼接字符串同时使用
SELECTT.,ROWNUMIDFROM(SELECTT.EMPLID,T.NAME,T.BU,T.REALDEPART,T.FORMATDATE,SUM(T.S0)S0,MAX(UPDATETIME)CREATETIME,LISTAGG(TOCHAR(
皕杰报表之UUID
​在我们用皕杰报表工具设计填报报表时,如何在新增行里自动增加id呢?能新增整数排序id吗?目前可以在新增行里自动增加id,但只能用uuid函数增加UUID编码,不能新增整数排序id。uuid函数说明:获取一个UUID,可以在填报表中用来创建数据ID语法:uuid()或uuid(sep)参数说明:sep布尔值,生成的uuid中是否包含分隔符'',缺省为
Wesley13 Wesley13
3年前
FLV文件格式
1.        FLV文件对齐方式FLV文件以大端对齐方式存放多字节整型。如存放数字无符号16位的数字300(0x012C),那么在FLV文件中存放的顺序是:|0x01|0x2C|。如果是无符号32位数字300(0x0000012C),那么在FLV文件中的存放顺序是:|0x00|0x00|0x00|0x01|0x2C。2.  
Stella981 Stella981
3年前
KVM调整cpu和内存
一.修改kvm虚拟机的配置1、virsheditcentos7找到“memory”和“vcpu”标签,将<namecentos7</name<uuid2220a6d1a36a4fbb8523e078b3dfe795</uuid
Easter79 Easter79
3年前
Twitter的分布式自增ID算法snowflake (Java版)
概述分布式系统中,有一些需要使用全局唯一ID的场景,这种时候为了防止ID冲突可以使用36位的UUID,但是UUID有一些缺点,首先他相对比较长,另外UUID一般是无序的。有些时候我们希望能使用一种简单一些的ID,并且希望ID能够按照时间有序生成。而twitter的snowflake解决了这种需求,最初Twitter把存储系统从MySQL迁移
Wesley13 Wesley13
3年前
mysql设置时区
mysql设置时区mysql\_query("SETtime\_zone'8:00'")ordie('时区设置失败,请联系管理员!');中国在东8区所以加8方法二:selectcount(user\_id)asdevice,CONVERT\_TZ(FROM\_UNIXTIME(reg\_time),'08:00','0
Wesley13 Wesley13
3年前
00:Java简单了解
浅谈Java之概述Java是SUN(StanfordUniversityNetwork),斯坦福大学网络公司)1995年推出的一门高级编程语言。Java是一种面向Internet的编程语言。随着Java技术在web方面的不断成熟,已经成为Web应用程序的首选开发语言。Java是简单易学,完全面向对象,安全可靠,与平台无关的编程语言。
Stella981 Stella981
3年前
Django中Admin中的一些参数配置
设置在列表中显示的字段,id为django模型默认的主键list_display('id','name','sex','profession','email','qq','phone','status','create_time')设置在列表可编辑字段list_editable
Python进阶者 Python进阶者
1年前
Excel中这日期老是出来00:00:00,怎么用Pandas把这个去除
大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Pandas数据筛选的问题。问题如下:这日期老是出来00:00:00,怎么把这个去除。二、实现过程后来【论草莓如何成为冻干莓】给了一个思路和代码如下:pd.toexcel之前把这