Google SRE之后的CRE,一起来看看吧

Stella981
• 阅读 496

Google SRE之后的CRE,一起来看看吧

去年10月份,也就是2016年10月份,Google Cloud Platform Blog上更新了一篇文章,Google宣布了一个新的专业岗位,CRE,Customer Reliability Engineering,直译过来就是客户稳定性工程师,按说去年的文章也不是什么新闻了,不过看到国内还没有专门的文章介绍,我就尝个鲜简单分享下。

CRE产生的背景

这个岗位出现的主要背景,还是越来越多的用户选择在云上开展自己的业务,甚至是很多的企业和用户从原来传统的自运维的IDC机房,将业务迁移到云上,这样做其实就是选择相信公有云平台,但是同时也就放弃了对底层基础设施的把控,甚至把企业最为核心的数据也放到了云上,说简单点就是,一个公司的身家性命都交给公有云了。

从Google多年的调研和了解看,虽然绝大多数的公有云都宣称自己的稳定性多么高多么好,但是实际情况并非如此,而绝大多数企业级用户也因为自己的业务在云上,所说始终都有非常强烈的焦虑感。

其实,我们可以看下Netflix,虽然业务在AWS上,但是自打在AWS上遇到过几次严重故障后,就开始自己做稳定性保障的功能,我们熟知的Chaos Monkey这只猴子就是这么来的,进而发展到后来的Chaos Engineering这样一整套体系。

可以看到,Netflix秉承的Design For Faliure,自打一开始就选择在变化多端且自己不可控的环境下,加强自己系统的健壮性和容错度。

但是不是任何企业都具备Netflix这样的技术能力把自己打造的这么稳定,所以在云上不稳定的情况发生时,通常公有云客户是手足无措的,因为他并了解出了什么状况,不知道是自己的问题还是云上基础设施和基础服务的问题,也不知道自己应该要从哪里入手恢复业务,所以时间长了必然会非常地焦虑,十分地焦虑,各种的不放心。

Google CRE岗位的职责

所以,CRE出现的根本目的,就是消除客户焦虑,真正的站在客户的角度去解决问题,同时对客户进行安抚、陪伴和关怀。

通常的售后支持,都是你问什么问题,我就回答什么问题,能马上解决的就马上解决,不能解决的就转到后端处理,然后让客户等着,承诺多长时间内给出答复。流程标准,SLA执行严格规范,对于一般问题还好,真要是出现大问题,业务挂了,我都火烧眉毛了,你还跟个机器人一样,我问啥你说啥,或者你排查下对我说跟你没关系,让我自己再检查下,再或者转给后端处理,你先等着,这个体验就非常差了。

所以,CRE这个角色一定是站在客户角度解决问题,加入客户的War Room,帮助客户一起排查,问题不解决,自己也不会撤,同时还会随时通报进展,必要的时候会将故障升级到更高的级别,寻求更专业的资源投入共同解决,同时根据客户的不同反应进行不同方式的安抚。

同时,CRE还会发挥Google多年积累下来的非常宝贵的线上运维经验,在日常就跟客户沟通传递一些稳定性保障的知识。CRE还可以按照Google总结出来的类似SRE的标准规范,对客户线上系统进行稳定性标准的评审,并给出专业的建议,如果客户同意遵守这样的标准规范执行,在后续出现故障时,CRE就完全可以按照非常成熟的SRE的运作模式去协作用户处理故障,这样就会大大提升CRE和客户的协作效率,为故障快速处理赢得更多宝贵的时间,同时CRE也可以发挥更大的专业作用,而不是之前对客户系统不熟悉,空有一身绝世武功,却使不上劲。

所以,CRE这个角色,既具备良好的专业技术能力,又有非常强的问题解决能力,同时还要具有优秀的客户沟通和关怀能力。而且背后还有Google多年的全球最佳运维实践——SRE的经验和方法论支持,也可以让CRE这个角色发挥出更加独特的作用,这一点可能是其它一般的公有云厂商难以达到的。

最后

随着近些年云计算技术的深入发展,和公有云事业的不断拓展,运维领域的分工也在不断的精分细化,而每个细分领域的专业技术要求也越来越高,我想这是一个好的现象,让原来非常模糊的运维行业范畴,变得越来越清晰,越来越具体,也让我们从事运维行业的同事有了更多的选择。

及时了解业界的技术发展趋势非常重要,更加有利于我们掌控自己的职业发展方向和优势技能的发挥。

这里推荐一下InfoQ旗下的ArchSummit大会,本届大会的新一代DevOps专题中,有来自阿里、百度、微博、滴滴以及拍拍贷的资深架构师,给我们带来在弹性容量管理、智能故障自愈、海量监控以及基础架构DevOps等领域的专业分享,可以让我们身临其境的感受到国内超一流架构师的技术风采以及业界领先的技术分享。

大会目前九折优惠,不过输入我的优惠码,享八折优惠!

大会八折专属优惠码:zhaocheng

Google SRE之后的CRE,一起来看看吧

本文分享自微信公众号 - 成哥的世界(forrest_thinking)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。

点赞
收藏
评论区
推荐文章
blmius blmius
2年前
MySQL:[Err] 1292 - Incorrect datetime value: ‘0000-00-00 00:00:00‘ for column ‘CREATE_TIME‘ at row 1
文章目录问题用navicat导入数据时,报错:原因这是因为当前的MySQL不支持datetime为0的情况。解决修改sql\mode:sql\mode:SQLMode定义了MySQL应支持的SQL语法、数据校验等,这样可以更容易地在不同的环境中使用MySQL。全局s
Wesley13 Wesley13
2年前
java将前端的json数组字符串转换为列表
记录下在前端通过ajax提交了一个json数组的字符串,在后端如何转换为列表。前端数据转化与请求varcontracts{id:'1',name:'yanggb合同1'},{id:'2',name:'yanggb合同2'},{id:'3',name:'yang
Jacquelyn38 Jacquelyn38
2年前
2020年前端实用代码段,为你的工作保驾护航
有空的时候,自己总结了几个代码段,在开发中也经常使用,谢谢。1、使用解构获取json数据let jsonData  id: 1,status: "OK",data: 'a', 'b';let  id, status, data: number   jsonData;console.log(id, status, number )
皕杰报表之UUID
​在我们用皕杰报表工具设计填报报表时,如何在新增行里自动增加id呢?能新增整数排序id吗?目前可以在新增行里自动增加id,但只能用uuid函数增加UUID编码,不能新增整数排序id。uuid函数说明:获取一个UUID,可以在填报表中用来创建数据ID语法:uuid()或uuid(sep)参数说明:sep布尔值,生成的uuid中是否包含分隔符'',缺省为
Easter79 Easter79
2年前
TypeScript 4.0正式发布!现在是开始使用它的最佳时机
!(https://oscimg.oschina.net/oscnet/9d5dde21c00d49b6b148bfabfc93db57.jpg)作者|DanielRosenwasser译者|王强策划|李俊辰稿源|前端之巅微软宣布TypeScript4.0正式版上线了!这一新版本深入改进了表现力、生产力
Wesley13 Wesley13
2年前
00:Java简单了解
浅谈Java之概述Java是SUN(StanfordUniversityNetwork),斯坦福大学网络公司)1995年推出的一门高级编程语言。Java是一种面向Internet的编程语言。随着Java技术在web方面的不断成熟,已经成为Web应用程序的首选开发语言。Java是简单易学,完全面向对象,安全可靠,与平台无关的编程语言。
Stella981 Stella981
2年前
Django中Admin中的一些参数配置
设置在列表中显示的字段,id为django模型默认的主键list_display('id','name','sex','profession','email','qq','phone','status','create_time')设置在列表可编辑字段list_editable
Stella981 Stella981
2年前
Google地球出现“无法连接到登录服务器(错误代码:c00a0194)”解决方法
Google地球出现“无法连接到登录服务器(错误代码:c00a0194)”解决方法参考文章:(1)Google地球出现“无法连接到登录服务器(错误代码:c00a0194)”解决方法(https://www.oschina.net/action/GoToLink?urlhttps%3A%2F%2Fwww.codeprj.com%2Fblo
Wesley13 Wesley13
2年前
MySQL部分从库上面因为大量的临时表tmp_table造成慢查询
背景描述Time:20190124T00:08:14.70572408:00User@Host:@Id:Schema:sentrymetaLast_errno:0Killed:0Query_time:0.315758Lock_
Python进阶者 Python进阶者
3个月前
Excel中这日期老是出来00:00:00,怎么用Pandas把这个去除
大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Pandas数据筛选的问题。问题如下:这日期老是出来00:00:00,怎么把这个去除。二、实现过程后来【论草莓如何成为冻干莓】给了一个思路和代码如下:pd.toexcel之前把这