做「容量预估」可没有true和false

如果第二次看到我的文章，欢迎「文末」扫码订阅我个人的公众号（跨界架构师）哟~
每周五11：45 按时送达。当然了，也会时不时加个餐～

我的第「85」篇原创敬上

随着20年来互联网的蓬勃发展，一个软件系统所要面对的访问压力上限被逐渐提高。

虽然如此，但是那些体量达到亿级或者是千万级的产品也只是少数公司的专属。对于整个行业里百万+的程序员群体来说，估计也就只有10%人有机会接触到这些“大系统”。

所以，一提到容量预估，大家可能第一时间想到的是，这是大公司的事，我们这种小系统不用考虑这个问题。

这说法其实不太对。现在这个时代，营销活动满天飞，初创企业更是在绞尽脑汁想着“一炮而红”，所以哪怕不是那些千万级以上的系统也需要考虑容量预估的问题。

对大型系统来说，容量预估是刚需，关乎到系统能不能扛住，或者投入的资源会不会过度浪费，毕竟1%都是好多钱呐。

而对小系统来说，多花个百八十万，多冗余一些资源也没问题。

虽然如此，但是Z哥觉得，能不能做好「容量预估」，背后体现的是一个人解决没有标准答案的问题的能力。

这是很多程序员都缺乏的一个能力。

所以，不管你当前是在大公司还是小公司，只要你希望提高你的架构能力，或者未来想有机会把握住在大公司的工作机会，那么这是一个必须要掌握的基本技能。

日积月累的程序员思维让大家都习惯了事事都有0和1，true和false。然而真正复杂的问题是那些没有标准答案的问题，在这些问题中，没有对和错，只有合适和不合适。

而且，如今大家的生活越来越“在线化”。如果一个系统的负载能力，我们一直不去关注它。那么，当好不容易熬到的“风口”真的吹来的时候，能把握住吗？还是眼睁睁的错过它们。

我想，大多数人对容量预估还是有一些概念的。通过数据推算出对系统承载能力的要求，并且实施满足要求的程序部署。

比如，下个月要做一轮大促。系统要达到一个什么状态才能顺利支撑大促的开展？

大家脑子里至少都会有这样的一个公式：

流量 / 单机性能 = X台机器

但我认为这个理解还可以再深入一些。Z哥的理解是：容量预估的本质是为了获得技术投入与业务发展之间的合理值，追求的是无限接近于“刚刚好”的状态。

要达到“刚刚好”的状态，必然意味着不能凭借拍脑袋办事，而要考虑到尽可能多的维度，采集更多维度的数据作为参考。

因为实际的情况，肯定不是像上面公式一样简单的线性关系。而是类似下面这样的对数曲线关系。

做「容量预估」可没有true和false

那么具体该怎么做容量规划呢？

在这之前我们先得搞清楚几个概念。

首先是指标。我们主要关注以下几个指标。

UV（Unique Vistor）：一段时间内的访客数，同一访客在该时段内的多次访问只计一次。
PV（page view）：一段时间内的页面浏览次数，同一用户多次打开同一页面也继续累计。
响应时间/系统延迟(Latency)：系统处理一个请求/任务的延迟（请求处理时间+数据传输时间）
吞吐量(Throughput)：一个单位时间内可以处理的请求数。也就是该单位时间内发起的请求总数/平均响应时间，请求数可以是一次pv、也可以是一次rpc调用等等。
TPS（Transaction Per Second）：可以理解为，单位时间是“秒”的「吞吐量」。

其次，我们要对会产生性能开销的地方要有认识。这主要分为3个部分。