OneAlert 入门(三)——事件分析

Stella981
• 阅读 479

OneAlert 是国内首个 SaaS 模式的云告警平台,集成国内外主流监控/支撑系统,实现一个平台上集中处理所有 IT 事件,提升 IT 可靠性。有了 OneAlert,你可以更快更合理地为事件划分优先级、分配路径,从而极大地提高团队的协作能力、优化协作流程。本文是 OneAlert 入门系列文章的第三篇,将帮助你快速了解和配置 OneAlert,从而挖掘该平台的最大价值。

OneAlert 入门(三)——事件分析

####事件分析 你此前用过的大多数工单系统或问题追踪系统都会要求你手动分类或联结工单。OneAlert 可不一样。OneAlert 事件流中的每个事件都是自动创建的,且以监控栈中实时产生的告警为基础。ZabbixNagios ,Solarwinds ,AWS CloudWatch ,阿里云 ,监控宝,腾讯云等国内外主流监控工具都能支持,而且新的应用正在快速集成。只要该工具会给 IT 和 DevOps(运维开发团队)产生告警,我们都会想办法与之集成。OneAlert 除了可以做一名合格的告警搬运工,还提供事件分析功能,目前包括总览、告警 Top 分析、告警压缩、应用,即将上线的还有面向 Team Leader 的团队分析、成员分析、通知分析功能。

OneAlert 入门(三)——事件分析

####Top分析----对告警内容和对象进行深入分析 OneAlert 提供两种 Top 分析,一种是根据告警内容产生告警的频繁次数进行排名分析;一种是根据告警对象产生告警的频繁次数进行排名分析。我们可以直观的看到哪些事件发生故障的次数排名,这样我们可以有针对的排除发生故障的原因,预防下次还频繁发生故障。我们还可以看相应告警的持续时间和 MTTA / MTTR,可以查看团队的工作效率,从而继续优化团队排班和升级策略。

OneAlert 入门(三)——事件分析

####告警压缩----减少噪音 生产环境中的一个问题可能导致多个告警。例如,一个磁盘问题可能会先导致磁盘 IO 告警。后者又很可能迅速触发一些列的 CPU,内存,数据库及应用告警。当然,在这种情况下,你可不想分开管理二十多个问题。实际上,它们都是同一个原因导致的。因此,OneAlert 会自动进行分组,将相关的告警整合为高级事件。OneAlert 的分组算法会使用主机名、集群和应用等信息,确保所有相关告警都分到同一组内。未来还会根据集群、应用和团队职责等进行分组。此外,算法还会考虑告警出现的时间顺序,使你对事件的了解更加深入。

OneAlert 入门(三)——事件分析

####前沿分享 以上事件分析功能主要面向运营团队的一线人员,未来我们将推出面向 Team Leader 的团队分析、成员分析、通知分析功能。让 Team Leader 可以直观看出团队设置的排版和升级策略是否需要继续优化,也可以看出每个人的确认告警的时间和解决故障的时间,查看整个团队和成员的工作效率。更多功能敬请期待。

OneAlert 能够实时地自动整合告警,并且通过多链路多种通知方式让告警最有效率的通知到相关人员,极大的缩短 MTTR,最后事件分析功能让团队价值最大化。这使 OneAlert 成为国内 IT 与 DevOps 团队管理并解决问题的最佳平台。在第四部分,我们会介绍如何在整个团队中使用该工具,从而最大限度地提高协作效率。

本文转自 OneAPM 官方博客

点赞
收藏
评论区
推荐文章
blmius blmius
2年前
MySQL:[Err] 1292 - Incorrect datetime value: ‘0000-00-00 00:00:00‘ for column ‘CREATE_TIME‘ at row 1
文章目录问题用navicat导入数据时,报错:原因这是因为当前的MySQL不支持datetime为0的情况。解决修改sql\mode:sql\mode:SQLMode定义了MySQL应支持的SQL语法、数据校验等,这样可以更容易地在不同的环境中使用MySQL。全局s
Stella981 Stella981
2年前
QQ 群也能接收告警啦!团队沟通力 Up Up!
截止到昨天,你已经可以通过OneAlert(https://www.oschina.net/action/GoToLink?urlhttp%3A%2F%2Fwww.onealert.com%2F%3Futm_source%3DCommunity%26utm_medium%3DArticle%26utm_term%3DQQ%2520%25E7%25
Wesley13 Wesley13
2年前
P2P技术揭秘.P2P网络技术原理与典型系统开发
Modular.Java(2009.06)\.Craig.Walls.文字版.pdf:http://www.t00y.com/file/59501950(https://www.oschina.net/action/GoToLink?urlhttp%3A%2F%2Fwww.t00y.com%2Ffile%2F59501950)\More.E
Stella981 Stella981
2年前
Jenkins+Ansible+Gitlab自动化部署三剑客
JenkinsAnsibleGitlab自动化部署三剑客小中大showerlee2016031113:00Ansible(https://www.oschina.net/action/GoToLink?urlhttp%3A%2F%2Fwww.
Stella981 Stella981
2年前
OneAlert 入门(一)——事件流
OneAlert入门(一)——事件流OneAlert是国内首个SaaS(https://www.oschina.net/action/GoToLink?urlhttp%3A%2F%2Fnews.oneapm.com%2Ftag%2Fsaas%2F)模式的云告警平台,集成国内外主流监控/支撑系统,实现一个平台上集中处理所有IT
Stella981 Stella981
2年前
OneAlert 入门(四)——事件分派和通知必达
OneAlert(https://www.oschina.net/action/GoToLink?urlhttp%3A%2F%2Fwww.onealert.com%2F%3Futm_source%3DCommunity%26utm_medium%3DArticle%26utm_term%3DOneAlert%2520%25E5%2585%25A5%25
Stella981 Stella981
2年前
Cloud Insight!StatsD 系监控产品新宠!
年关将至,CloudInsight(https://www.oschina.net/action/GoToLink?urlhttp%3A%2F%2Fwww.oneapm.com%2Fci%2Ffeature.html%3Futm_source%3DCommunity%26utm_medium%3DArticle%26utm_term%3DClou
Stella981 Stella981
2年前
OneAlert 入门(二)——事件分析
OneAlert(https://www.oschina.net/action/GoToLink?urlhttp%3A%2F%2Fwww.onealert.com%2F%3Futm_source%3DCommunity%26utm_medium%3DArticle%26utm_term%3DOneAlert%2520%25E5%2585%25A5%25
Wesley13 Wesley13
2年前
MySQL部分从库上面因为大量的临时表tmp_table造成慢查询
背景描述Time:20190124T00:08:14.70572408:00User@Host:@Id:Schema:sentrymetaLast_errno:0Killed:0Query_time:0.315758Lock_
Python进阶者 Python进阶者
4个月前
Excel中这日期老是出来00:00:00,怎么用Pandas把这个去除
大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Pandas数据筛选的问题。问题如下:这日期老是出来00:00:00,怎么把这个去除。二、实现过程后来【论草莓如何成为冻干莓】给了一个思路和代码如下:pd.toexcel之前把这