Ignite2.8版本发布:减轻生产压力和提高机器学习能力

Stella981
• 阅读 399

Apache Ignite 2.8做出了数千项变更,这些变更几乎增强了平台的所有组件,但本文不会面面俱到,主要是指导Ignite开发人员关注核心的增强功能,详细的更新列表请看这里。

新的产品监控和跟踪子系统

很多Ignite开发者将Ignite部署于核心应用系统,并希望Ignite可以与许多外部监控工具集成并易于扩展,基于此,Ignite团队花费了几个月的时间,开发了一个强大而灵活的监视和分析子系统,用于生产监控和诊断(也称为分析)。

新的子系统由多个与特定的Ignite组件相关的单独分组的指标注册表组成,例如可以找到和缓存、计算或服务网格API相关的注册表。由于注册表是通用的,因此可以通过大量支持各种协议的工具来观察Ignite的状态。Ignite 2.8为监控接口默认也提供了若干个出口,比如日志文件、JMX和SQL视图之类,同时也支持诸如OpenCensus之类的现代工具。

目前,此新子系统以实验性模式发布,只是给Ignite开发者一些时间来验证新API并提出改进建议。

机器学习能力提高

Ignite 2.8的机器学习(ML)功能与以前的版本有很大的不同,目前已经稳定,开发者可以放心使用了。

模型训练通常是一个多步骤的过程,包括预处理、训练和评估/验证阶段。新的流水线API通过将所有阶段组合成单一的工作流来简化这个过程。

除了流水线API,Ignite 2.8引入了集成方法,该方法可以将多种机器学习技术组合到一个预测模型中,以减少方差(装袋)和偏差(增强),或改善预测(堆叠)。

此外,现在还可以将Apache Spark或XGBoost模型导入Ignite进行进一步的推断,导向其他任务。以后可以随时使用喜欢的框架来训练模型,并在模型需要在生产中部署并大规模执行时将其转换为Ignite表示。

超越Java:分区感知和其他改进

虽然Ignite是一个Java中间件,但是也可以用作跨平台的数据库和计算平台,用于以C#、C++、Python和其他编程语言开发的应用。

瘦客户端协议是其他编程语言支持的真正核心能力,并且在Ignite 2.8中通过支持分区感知获得了显著的性能优化。其允许瘦客户端将查询请求直接发送到持有该数据的节点。在没有分区感知时,应用是通过瘦客户端接入集群中的单个服务端节点来执行所有查询和操作,该服务端节点实际承担了代理的职能。

减轻生产压力

本节列出的内容可能没有醒目的标题,但是这些改进大幅优化了生产中的自动化,以及避免了出现数据不一致的情况。

Java垃圾回收器触发的停顿会影响Java应用的性能、响应能力和吞吐量。Ignite有一个分区映射交换(PME)进程,和Java垃圾回收类似,该进程的某些阶段为了集群范围内的一致性会阻塞所有正在运行的操作。对于大多数Ignite使用场景,这些阶段会迅速完成,并且不会影响性能,但是对于某些低延迟或高吞吐量的场景,可以检测到可能会暂时影响某些业务运行的性能下降。在Ignite 2.8中做了很大的改进,即如果当前基线拓扑范围内的节点离开集群或胖客户端接入集群,则不会再发生PME阻塞。

还有,故障总是会发生,所以系统如何处理故障非常重要。在Ignite 2.8中重新审视了集群在重启时处理故障恢复的方式。此外还添加了读取修复功能,以动态管理集群的主备副本之间的数据不一致。

另外值得一提的是,Ignite 2.8通过支持持久化数据文件和预写日志的压缩,改进了磁盘空间占用。通过减少压缩算法所需的CPU周期,可以节省很多存储空间。

最后但并非不重要的一点是,新版本支持基线的自动调整,该功能在无需干预的情况下,可以为打开Ignite原生持久化的集群自动调整拓扑。

点赞
收藏
评论区
推荐文章
blmius blmius
2年前
MySQL:[Err] 1292 - Incorrect datetime value: ‘0000-00-00 00:00:00‘ for column ‘CREATE_TIME‘ at row 1
文章目录问题用navicat导入数据时,报错:原因这是因为当前的MySQL不支持datetime为0的情况。解决修改sql\mode:sql\mode:SQLMode定义了MySQL应支持的SQL语法、数据校验等,这样可以更容易地在不同的环境中使用MySQL。全局s
Wesley13 Wesley13
2年前
java将前端的json数组字符串转换为列表
记录下在前端通过ajax提交了一个json数组的字符串,在后端如何转换为列表。前端数据转化与请求varcontracts{id:'1',name:'yanggb合同1'},{id:'2',name:'yanggb合同2'},{id:'3',name:'yang
Jacquelyn38 Jacquelyn38
2年前
2020年前端实用代码段,为你的工作保驾护航
有空的时候,自己总结了几个代码段,在开发中也经常使用,谢谢。1、使用解构获取json数据let jsonData  id: 1,status: "OK",data: 'a', 'b';let  id, status, data: number   jsonData;console.log(id, status, number )
皕杰报表之UUID
​在我们用皕杰报表工具设计填报报表时,如何在新增行里自动增加id呢?能新增整数排序id吗?目前可以在新增行里自动增加id,但只能用uuid函数增加UUID编码,不能新增整数排序id。uuid函数说明:获取一个UUID,可以在填报表中用来创建数据ID语法:uuid()或uuid(sep)参数说明:sep布尔值,生成的uuid中是否包含分隔符'',缺省为
Wesley13 Wesley13
2年前
Java获得今日零时零分零秒的时间(Date型)
publicDatezeroTime()throwsParseException{    DatetimenewDate();    SimpleDateFormatsimpnewSimpleDateFormat("yyyyMMdd00:00:00");    SimpleDateFormatsimp2newS
Stella981 Stella981
2年前
Android So动态加载 优雅实现与原理分析
背景:漫品Android客户端集成适配转换功能(基于目标识别(So库35M)和人脸识别库(5M)),导致apk体积50M左右,为优化客户端体验,决定实现So文件动态加载.!(https://oscimg.oschina.net/oscnet/00d1ff90e4b34869664fef59e3ec3fdd20b.png)点击上方“蓝字”关注我
Stella981 Stella981
2年前
Django中Admin中的一些参数配置
设置在列表中显示的字段,id为django模型默认的主键list_display('id','name','sex','profession','email','qq','phone','status','create_time')设置在列表可编辑字段list_editable
Wesley13 Wesley13
2年前
MySQL部分从库上面因为大量的临时表tmp_table造成慢查询
背景描述Time:20190124T00:08:14.70572408:00User@Host:@Id:Schema:sentrymetaLast_errno:0Killed:0Query_time:0.315758Lock_
为什么mysql不推荐使用雪花ID作为主键
作者:毛辰飞背景在mysql中设计表的时候,mysql官方推荐不要使用uuid或者不连续不重复的雪花id(long形且唯一),而是推荐连续自增的主键id,官方的推荐是auto_increment,那么为什么不建议采用uuid,使用uuid究
Python进阶者 Python进阶者
3个月前
Excel中这日期老是出来00:00:00,怎么用Pandas把这个去除
大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Pandas数据筛选的问题。问题如下:这日期老是出来00:00:00,怎么把这个去除。二、实现过程后来【论草莓如何成为冻干莓】给了一个思路和代码如下:pd.toexcel之前把这