杂记
已经很久没有写东西了,所以我知道,我必须写点什么了。正好,在新公司刚刚收到了转正通知的邮件和定级通知的邮件,一切都定了,虽然这些自然而然的事,但过程都经历了,还是想确认一下结果。
提笔之前想了很久,要写什么,总不能一直都碎碎念,所以我决定这篇文章写写服务中的监控。说到底,互联网行业也算是服务行业,我们做出的产品,无论是网站还是app,都是给用户提供服务、提供方便的,因此就需要竭尽所能的把服务的稳定性做到最好,任何时候都不能掉链子。
这里用我老大一直强调的一点就是,要有极强的 互联网运营意识 。自己的线上服务,需要做到对任何情况都要了解,要做到如此,就需要全方位的监控:
- 服务的总流量监控以及同比和环比;
- 每个接口流量的监控以及同比和环比;
- 每个接口的主调和被调的流量的监控;
- 每个接口的主调和被调的异常率、超时率、异常数、超时数;
- 每个接口的调用耗时上报;
- 代码中,所有log的地方都应该加上用户的唯一标识,比如QQ号、自己生成的guid、imei号等等;
- 每个请求的入口和出口都必须要有log,可以方便统计和追溯;
还有一点真的就是靠意识了,就是上面任何一种告警都要关注和处理,比如流量的波动,1%的异常或者超时率等等。
前几天在内网上看到一篇采访,是安全界比较有名的 TK教主 的采访,其中有问到,公司加班这么严重,技术人员还能怎么提升自己等等一系列的的问题,看了很受用的,只能说,教主就是教主。
看动画片了,不写了…
2015.12.27 20:00