北京某公司是一家以建筑材料设计、生产、销售为一体的大型制造企业。2010年,该公司数据中心机房重新设计,从办公大楼地下一层转移到三层。新机房建成后,将担负企业关键数据业务存储及大量核心计算处理,涉及到的应用包括:ERP、PLC、MES、OA、CAD、CAM(数控设备)、工程/销售系统、网站、email、财务系统、杀毒软件、机房监控与预警系统、考勤系统等,其中大量的设备,如服务器、网络、存储、电脑、打印机、防火墙、以及电话程控机等,都需要数据中心机房提供可靠、稳定和安全的基础设施制成。
由于计算机和服务器对周围运行环境要求较高,因此如何合理规划机房建设,是关系计算机和服务器能否可靠稳定运行的一个重要因素。新的数据中心机房在选址布局、供电系统、接地系统、空调系统设计方面进行了精心部署。
选址和布局
机房选址方面,首先需要考虑的因素包括:防尘、防震、防磁、防潮、防静电等因素。机房是公司所有网络设备存放与管理的重要场所,因此机房环境好坏会直接影响公司网络设备是否安全、高效地运行,同时也是确保运维人员是否具有良好工作环境的重要因素。机房选址应尽量避免以下三种地方:1:潮湿、低洼、尘埃、落雷区、有害气体污染区;2:强电场或磁场区;3:临近火灾、噪声源及强振动源区等。
公司老机房由于是建在办公楼地下一层,除了在选址方面没有考虑上述因素外,还有机房周围人员流动非常频繁,这也对机房的安全管理带来相当大的隐患。因此公司最终决定把新机房选在各方面环境条件都非常好的中心大楼三层。机房布局方面,新机房采用的是由一个主控室和若干个辅控室、配电室、更衣室和资料室组成。主控室主要是放主机、打印机、控制台终端等设备,为系统管理员工作间;辅控室主要放置终端,处理日常业务;配电间用于电源安装;更衣室用于更衣、换鞋;资料室主要存放备用品、业务资料及各类消耗品等等。在机房内各室之间采用铝合金玻璃墙隔断,保证各区域间的独立性与安全性。
供电系统
在公司机房内大多数电缆线都是多股铜线组成,插座也安装在非常明显与方便的位置,火线、零线、接地线一应齐全;供电采用三相五线制。同时还配置合适的UPS不间断电源。
接地系统
目前计算机机房比较流行接地系统有四种方式:1:防雷保护接地;2:交流工作接地;3:安全保护接地;4:直流工作接地。接地电阻也有四种可参考的要求:①交流工作地的接地电阻<4Ω;②安全保护地的接地电阻<4Ω;③防雷保护地的接地电阻<10Ω;④计算机直流工作接地电阻的大小。而新机房机房采用的是上面第一种方式实施。
空调系统
机房的湿度、温度和清洁度等对机房中各种设备的正常运行及使用寿命是有非常大的影响,所以在机房设计时就应充分考虑选择合适的空调系统。新机房采用机房专用精密空调机组,使机房环境温湿度参数达到以下标准:开机时中心机房温度控制在18~28℃,相对湿度40%~70%,温度变化率<5℃/h并不得结露。停机时中心机房温度在5~35℃,相对湿度20%~80%,温度变化率<5℃/h并不得结露。
运维的收获
从新机房建成后运营一段时间来看,切实给公司业务协同和内部管理带来了突破性的发展。以运维为例,已往机房运维工作过程中,要是出现某个问题,通常情况下,运维人员无法一下对问题精确定位,需耗费大量时间挨个排查来解决问题。这样,即耗费时间,也耗费人力。
如何在人员和时间条件有限的情况下,及时高效地做好运维工作,就成为信息部运维人员急迫需要攻克的新课题。后经过信息部运维人员大量的分析、研究发现,完全可以在公司现有的条件下,借助计算机自身的优势以及当前新技术(如:物联网、云计算等)来研发一套机房监控与预警管理系统。让这套系统来帮助我们定位和排错。这样一来的话,就可以解决我们当前所面临的困惑。
在设计上,首先在新机房中安装多种传感器设备,传感器设备分别按照事先设定的规则智能采集某一方面故障或告警信息,然后通过通讯设备把采集到的数据传送到监控中心,当监控中心接到相应数据后,会按照种类进行不同形式分类,归纳为不同告警级别,再通过监控中心中的运维处理模块快速进行故障定位和分析,并通过手机短信息或邮件等方式报送给运维人员。
运维人员当接收到相关信息后,根据专家模型及时找到问题产生的原因并快速做出解决问题的判断,而所有这些过程都是人机协作共同完成,并且系统会对每一个步骤中所产生的数据进行详细记录,方便日后的统计与查阅。当然,运维人员也可以通过手机短信/WEB浏览器等方式随时查看已往机房内所有设备的各种故障/告警信息以及远程控制机房内的各种设备开/关等活动。
这些改进,就使得我们运维技术人员可以节省大量的维护时间,并高效地对机房进行实时监控与管理。系统中还提供了丰富多样的报表,可以多维度满足信息部日常对机房运维工作中产生的各种信息进行查询、分类、汇总、分析等工作。
结合数据中心机房建设,对于制造企业而言,在建设中要切实做到先进性、安全可靠和舒适性。要采用先进成熟的技术和设备,即能满足当期的需求,还具有良好的发展潜力,以适应未来业务的发展和技术升级的需要。同时机房中的各个子系统间通过集成,实现信息共享、资源共享,增强对机房的运营管理能力;提高机房内各种设备利用率,节约能源,降低能耗。
为确保机房能为公司各项业务提供7×24小时连续不间断地服务,机房必须具有高可靠性及严格的安全保障制度。所以新机房采用了视频监控系统、门禁系统、24小时完备的摄录影像系统及出入机房登记制度等方式来保障机房的设备和数据不受侵害。新机房设计时,需要对照明、声响、空调及环境等方面进行优化调整,调整后的新机房能给运维人员提供一个温馨、舒适的工作环境。这也可以体现公司以人为本的文化理念。