信息化 频道

人比设备重要 冗余技术难抵小概率事件

    【IT168 专稿】为了增加可靠性,公司的网络使用采用一些冗余技术。两台核心交换机,采用了热备冗余的方式;每个楼层配置两台交换机,两台交换机互连,每台交换机再分别连到核心,实现冗余连接。
 
    没想到,前几天有一台核心交换机还真的坏了。虽然这是意料之中的事,但影响还是挺大的。在事实前面,这些冗余技术显得如此脆弱。
 
    原为了提用利用率,两台核心交换机的功能还是有所差别的,因此有以下影响:①DHCP服务只是配置在坏的那一台核心交换机上,因此虽然网络物理上是连通的,但实际上还是不能用了。②CISCO限制可作热备的VLAN只有16个,因此两台交换机上的VLAN配置还是有所不同的,也影响系统的正常使用。③为了减少故障环节,把与集团的连接直接连到核心交换机上,偏偏这台核心交换机坏了,因此集团的网络也不能访问了。
 
    更脆弱的是,有几个楼层也未达到的冗余效果:①有一个楼层两台交换机互连的端口,其中一个端口的GBIC卡坏了,因此造成其中一台到核心的两条通道全不通了。以前以为两条通道都坏是件小概率的事件,现在就恰恰遇到了。②有一个楼层的台交换机的互连本来就没配置好,平时发现不了,这时就造成大问题了。
 
    经过紧张的调整,网络已全部恢复正常。但这次事件使我们得出两个经验教训:①冗余是必要的,但是由于先天设计的、技术上的、性价比等原因,不可能做到完全可靠。还是需要平时做好应急预案,提高技术水平,才能在危难时刻显身手。人的应变能力有时比设备的可靠性更重要,因此觉得自己还是不会下岗的。
 
    ②不能因为有冗余技术就放松管理,平时还是应该多检查。因此我们根据这些问题和教训,对原来的方案进行了调整,原来的双核心均衡改成主备方式,即分为主核心交换机、备核心交换机、辅助核心交换机。

    原文章来自:http://lxm365.blog.ccidnet.com/blog.php?do=showone&itemid=182300&typ=blog
0
相关文章