Johnny21 Johnny21
3年前
运维安全-信息安全
本文转自,如有侵权,请联系删除。
Johnny21 Johnny21
3年前
谷歌SRE理论读书札记:SLI、SLO与SLA
趁着这被人扫地出门,无地可去的日子,多学习学习别人的理论知识。书籍名《SiteReliabilityEngineering》网络运维工程,编者BetsyBeyer,ChrisJones,JenniferPetoff,NiallRichardMurphy第二部分规则(Principles)
Stella981 Stella981
2年前
Debezium日常运维手机
关于KafkaConnect:(1)是否可以动态添加已有数据的新表? 不可以,KafkaConnect需要配置先行。如果是已有数据的新表,无法通过修改已有的kafkaconnect配置进行新表的Snapshot初始化。建议通过tablewhitelist功能,进行新表的snapshot。然后等到稳定后,再合并到同一个Kafkacon
Stella981 Stella981
2年前
Nginx日志运维笔记
在分析服务器运行情况和业务数据时,nginx日志是非常可靠的数据来源,而掌握常用的nginx日志分析命令的应用技巧则有着事半功倍的作用,可以快速进行定位和统计。1)Nginx日志的标准格式(可参考:http://www.cnblogs.com/kevingrace/p/5893499.html(https://www.oschina.net/ac
Wesley13 Wesley13
2年前
IT:从运维到运营
_本文转自公众号:傲寒荐书,作者:陈傲寒__IT运维?IT运营?__都是ITOperations,有什么区别?__IT运维管理?IT运营管理?__都是ITOM,有什么区别?__一字之差,只是翻译不同,还是另有玄机?__其实,_中文真的是一门更精确的语言:)_IT运维是“活着”,IT运营是“活得好”;_
Wesley13 Wesley13
2年前
ECS主动运维2.0,体验升级,事半功倍
_摘要:_ 阿里云致力于提供更好用的运维体验,让您使用ECS的过程更透明、高效,并实现更加标准化、自动化的运维方式。基于主动运维2.0,您使用ECS云服务器的体验更加流畅,而且利用系统事件,不再依赖于工单联系客服,可以通过自助处理的方式响应主动运维实例重启,减少对系统可靠性和业务连续性的影响。   云服务器ECS(ElasticCompute
Stella981 Stella981
2年前
CODING DevOps 系列第六课:IT 运维之智能化告警实践
IT运维告警现状目前IT运维领域保证服务运行正常的主要方法是对相关运维指标进行实时监控,并根据经验设定一些规则,通过将实时监控的数据与规则进行对比,当某个指标监控值不符合设定的规则时,则判定为异常的状况,这样的话就会发送对应的告警到告警平台。告警平台收到通知后,会分配给对应的运维人员进行处理,运维人员去根据告警信息来排查,最终定
Stella981 Stella981
2年前
Linux日常运维小结
1\.如何看当前Linux系统有几颗物理CPU和每颗CPU的核数?物理cpu个数:cat/proc/cpuinfo|grepc'physicalid'CPU一共有多少核:grepcprocessor/proc/cpuinfo将CPU的总核数除以物理CPU的个数,得到每颗CPU的核数。2\.查看系统负载有两个常用的命
Stella981 Stella981
2年前
AIOps在美团的探索与实践——故障发现篇
!(https://oscimg.oschina.net/oscnet/up45fc0178edcbec3835316f2c637b1b3f793.JPEG)一、背景AIOps,最初的定义是AlgorithmITOperations,是利用运维算法来实现运维的自动化,最终走向无人化运维。随着技术成熟,逐步确定为Artificial
初识DevOps
基本概念和延伸的思考DevOps,是Development(开发)和Operations(运维)组成的复合词,一般译为“开发运维一体化”。看到这个概念,首先会产生几个问题:开发是什么,哪些环节是开发?运维是什么,哪些环节是运维?开发人员写好代码在本地调试,环境出问题了自己来调整,这是开发工作还是运维工作?系统故障后,运维人员发现是配置文件内容出错了就改成了正