2017年10月微平台服务器网络运维报告

2017-11-01  类型:特别通知  浏览:40

         本文档为微平台服务器 部分服务器运维监控的月度报告,通过本报告能够反映在该月微平台系统服务器网络的整体运行状态,即网络的可用率、速度和稳定性. 运维监控的服务器分别有大陆节点和香港节点,通过监控可评估出大陆节点与香港节点的稳定性和速度差异,同时也有利于我们做好对服务器运行的中断异常、站点访问的状态 进行及时的监控报警工作。 

以下是2017年10月份期间,微平台大陆节点服务器的 可用率、稳定性、速度等的监控截图数据.


大陆节点A服务器

1、代理平台站点 HTTP请求总耗时  (IP: 139.199.215.206 )


图A-2-1

图A-2-2

如上图A-2-1 所示 大陆节点A代理平台在10月份 北京联通和广东电信两个地区检测点HTTP请求耗时曲线图,http请求总耗时、连接时间在本月期间继续保持了网络的平稳良好 ,北京联通该检测点线路 “连接时间”有多次明显的起伏 这应该是不同地区线路的波动, 图A-2-2 ,此图所示10月份大陆节点A的代理示例站是100%可用率,大陆A节点代理站的网络没有故障中断记录. 

 

2、微平台站点 可用率&响应时间 (示例其中三台服务器)  

a、IP: 183.60.216.197 (vip.zhanh.com)


图A-2-3


图A-2-4


bIP:119.29.51.152  (vip2.zhanh.com)


图A-2-5


图A-2-6


C  IP119.29.51.153 vip3.zhanh.com


图A-2-7


图A-2-8

图A-2-3、A-2-5、A-2-7 监测了10月份大陆A节点 其中3台服务器微平台站点的http耗时、DNS解析时间、连接建立时间、下载数据时间,如数据图所示 大陆A节点的微平台站的网络质量整体仍是稳定良好的情况,偶尔有几次突然的网络波动 属于正常的现象; 但10月26日 vip3分组受到三次DDOS流量攻击IP被封,期间曾暂时切换到美国网络的IP,所以如图A-2-8所示有轻微故障状态比率.


B.大陆节点B服务器

IP:124.172.150.124

代理平台站点 可用率&http请求耗时


图B-2-9


图B-2-10


IP124.172.150.119

微平台站点 可用率&http请求耗时


图B-2-11


图B-2-12


大陆节点 图B-2-10所示北京联通监控点的网络访问 http耗时波动较为频繁,这是不同地区网络线路存在差异 南北网络互通访问该节点出现的波动;图B-2-12 所示大陆B节点的微平台整体情况就比较平稳良好,未出现断线情况 保持有百分百可用率.


C、香港节点服务器 (示例其中7)

1.微平台站点 可用率&http耗时请求

服务器IP 118.193.170.71     


图C-2-13


图C-2-14


服务器IP 118.193.166.139



图C-2-15


图C-2-16


服务器IP 118.193.146.254


图C-2-17


图C-2-18


服务器IP 119.28.37.68


图C-2-19


图C-2-20


服务器IP 119.28.39.160


图C-2-21


图C-2-22


如上图所示, 其中5台的香港服务器监控截图数据显示了10 月HK网络微平台站点的http请求耗时和连接时间、DNS解析时间、下载数据时间的. 从以上截图数据 可明显看出 “北京联通”该监测点的http耗时波动比较频繁,广东电信监测点相对比较稳定良好。因为10份期间乃是中国十九大会的召开 国内加强了对于境外网络访问的管控和调整,频繁出现因为骨干线路的拥堵、维护调整等情况,导致从大陆访问香港节点延时升高+掉包 影响站点访问速度. 以下是10月份香港节点网络的微平台网站IP 受攻击、骨干网络异常、机房维护等记录:


10月01日

约01:00AM 香港节点IP 118.193.250.11 (dns.zhanh.com)攻击被封

约02:35AM 腾讯云香港IP 119.28.7.223 攻击被封.

约09:20AM香港节点IP 118.193.166.145 攻击被封.

10月05日  约 00:25AM 香港节点IP 118.193.250.11 (dns.zhanh.com)攻击被封

10月09日 约14:00PM 沙田机房网络突然大面积中断丢包,持续约3分钟,判断乃是机房大网受到DDOS流量攻击所影响. 

10月11日  腾讯云通知将于凌晨00:00-06:00 电信运营商进行第二京汉广湖北段光缆割接。割接期间可能造成南北互联网访问质量异常.

10月11-12日  由于联通与CN2电信节点的互联互通故障 导致延时高、丢包,国内部分地区联通用户访问香港沙田机房主机网络的站点打开失败, 我们暂时将IP切换至腾讯云香港机房 保持用户后续的正常访问. 

10月13日  约10:00AM 国内部分城市访问到华南、华东地区出现网络延时上升、丢包情况,部分用户访问国内微平台站点,速度可能受到影响,机房确定为运营商故障.约1小时后恢复.

10月14日 约14:50PM 国内部分地区访问香港机房网络 出现丢包 延时增高,站点正常访问速度受影响,大约15分钟后恢复. 

10月19日 约15:00PM 国内访问所有香港的机房网络都出现异常,原因是香港电信线路故障 约30分钟后恢复. 

10月22日 约11:00AM 国内因为一个用户站点被CC攻击,导致国内服务器带宽严重超标,影响国内站点打开速度,我们封闭了攻击来源IP.

约14:47PM 香港节点其中一个IP 119.28.38.232 (s116)刚攻击被封,已经切换. 

10月24日 开始陆续有个别国内用户使用鹏博士、长城宽带、铁通网络访问不了香港站点,核查香港机房服务器网络并无异常,机房工程师检查判断 这是这些运营商本身线路的问题, 鹏博士、长城宽带、铁通其实在国内属于劣质网络 容易出现各种访问异常的问题 尤其是访问境外的网络,建议用户使用电信或者联通这些优质带宽,或者域名在腾讯云完成备案 这样可以将站点网络迁移到国内.

10月26日 上午约11:40AM  国内vip3分组119.29.122.156 攻击被封,切换新IP后陆续被封两个IP.

10月29日 20:30PM 香港的网络整体出现波动 丢包,香港网络的站点访问速度受影响 持续约20分钟 恢复正常.


2. 代理平台站点 可用率&响应时间

a、HK- IP 119.28.38.244  

示例代理站点可用率、http访问耗时、服务器响应时间、DNS解析时间


图C-2-23


图C-2-24


b 、HK-IP 118.193.166.133

示例代理站可用率、http访问耗时、服务器响应时间、DNS解析时间


图C-2-25


图C-2-26

以上截图是2017年10月 其中两台HK服务器的代理平台示例站点 (响应时间、HTTP总耗时和DNS解析时间\下载数据时间)情况,图C-2-24所示北京联通监控点相比广东电信的连接建立时间出现频繁波动,所以最终http耗时时间也较高,广东电信监测点的网络情况是比较平稳的,代理平台站香港节点在10月期间虽未受到DDOS攻击,但同样因十九大因素 国内对于境外网络访问的加强管控和调整,频繁出现因为骨干线路的拥堵、网络异常波动等情况.


       总结: 大陆节点A腾讯云机房10月份有1次骨干光缆割接维护 但维护护时间都是在凌晨 据我们所监控并没有导致访问异常现象; 国内vip3分组虽然曾受到两三次DDOS攻击,但其实国内网络的整体情况都是非常稳定良好的; 香港节点的网络在10月稳定性较差 多次不同分组的IP受到DDOS攻击,而且常出现短时间的波动和丢包,主要是国内对境外网络的调控 或者 骨干线路拥堵问题 影响香港站点访问速度,因为十九大即将召开,国家对于网络的监控和控制加强了  屏蔽了某些特殊端口、调整限流,并要求主机商清理违法违规的网站内容, 特别是对海外网络访问 例如香港\美国的网络 更容易受到影响,建议用户可域名进行备案 转移至我们国内主机节点. 10月份下旬陆续收到个别国内用户使用鹏博士、长城宽带、铁通网络访问不了香港站点,这并不是香港机房网络的问题,而是用户所使用的该运营商异常,需联系当地“鹏博士、长城宽带、铁通”运营商报障处理,我们建议最好是域名进行备案后转到国内的网络,或者更换本地的网络带宽为电信、联通这些优质网络提供商.

服务器网络运维监控规范:

1、7*24小时的监控  

确保问题无遗漏及时响应处理.

2、4名运维工程师轮值 

发现有问题报警时,第一时间检查核对是否误报,使用软件工具或者登陆服务器基本判断问题所在,并向渠道客服部门发布通知.

大型问题及时通知经理和总监协助处理.

3、多样化的监控工具

A、360网站监控和监控宝进行http站点监控 、可用率、响应时间的监控. 

B、PRTG软件监控所有服务器当前网络连接状态,同时还有加入阿里云监控网络连接状态和丢包情况

4、通知提醒和应急措施

保持手机24小时开机状态,手机有短信通知提醒,电脑有邮件通知提醒,每当出现报警提醒 都能快速发现和响应处理; 如果是网络问题或者因DDOS攻击IP被封,有备用IP和抗攻击机房的IP进行紧急切换;如是机器物理性故障,因为采用了服务器集群,一样可以切换到其它的相关服务器接管应用,保证微平台系统正常运行.

5、数据库备份

异地备份,定时执行数据同步任务计划,并每天检查确保数据备份完整.

发布人:技术服务中心

上一篇:最新加入分站版本: 企业版

下一篇:停止后台提供运维报告通知