

影响服务器稳定与安全之因素主要有服务器的电源供应、散热系统、服务器主板选择、软件运用等,服务器的稳定性提高也是根据实测结果进行不断改进的过程。在此总结一些服务器电源和散热、主板选用等方面的经验,供大家参考。
一、 电源供应器
各位电子爱好者都知道,电源对于电子系统来说是何等的重要。电源质量的优劣直接影响到系统的稳定和硬件的寿命,并不是简单地将220V交流变换成服务器所需低压直流这么简单。服务器电源必须能应付各种苛刻的工作环境,同时还要求常年不间断地工作。随着CPU的速度提升,硬盘容量和转速等越来越大、越快,功耗就随之升高,对电源的要求就更高了。服务器与日常用计算机不同,通常支持多个CPU,使用多个SCSI硬盘,RAM容量一般超过2G,其功耗相对大得多就不足为奇了。比如Intel P4 3.2G CPU功耗达82W,SCSI硬盘功耗也在10W以上,加上主板和其它配件的功耗,一般的PC电源仅200W左右的功率是应付不来的。对1U机箱服务器来说,电源功率一般应达到300W,2U应达到350W,以保证供电功率足够。实践经验告诉我们,电源功率不足或过热,是服务器经常自动重启(Reboot)的一个重要原因。其实也很容易理解,当您的CPU负荷增加、硬盘突然读写大量数据时,因负载变化造成电源电压波动是在所难免的。高品质的电源在设计时充分考虑到这些因素,出问题的可能性就少得多了。熟悉电子制造的朋友们都知道,名牌大厂的产品设计和制造工艺对产品品质来说比较有保证。
二、 散热
服务器硬件一般放在1U、2U机箱内配合机架统一使用,在狭小的空间里有大量的硬件高速运行,且服务器一般要求24小时不间断工作,散发的热量非常大。那么,怎样才能有效降低服务器内部温度呢?首先,服务器机箱材质就很重要。首选全铝质或者铝合金,次选铁板。颜色应漆成黑色,以利于散热。CPU散热器宜采用全铜及直接整体切割而成的,为达到最佳效果,须配合品质好的散热膏并正确地使用。其次,风扇的选择也很重要。CPU是服务器的核心,也是“热心”(发热的中心)。Intel P4 CPU温度75℃ 及AMD CPU温度86℃是工作温度极限,高温时CPU会自动将降低工作效率。要降低CPU的温度,首先是增加传导面积,用优质的散热器,并尽量增加表面积;其次就是要降低周围环境温度;还有就是加大其周围空气对流,风扇就派用场了。散热风扇的选用也是一门学问。高风量(CFM)散热风扇可有效降低服务器内部温度。散热风扇一般分滚珠轴承、油封轴承两种。滚珠轴承较为耐用,虽噪声略高,但服务器一般在机房中工作,通常采用无人看守远程监控,所以噪声略大也可接受。可从风扇上标明的A(电流)和W(功率)来初步判断风量,数字越大一般风量也越大。建议大家选择Delta、Sunon、Nidec、Sanyo、Y.S.Tech等名牌。近期Sanyo推出1.5万转4cm电流0.55A风量20.83CFM及24.71CFM的超强力风扇,是1U服务器散热较佳配搭。 电源本身是服务器中一大热源。如Sirtec产的PUA-40060-PB1电源,自带2个风扇,使其工作温度不会太高。笔者试将Nidec风量15.53CFM的风扇换成Sanyo风量20.83CFM的风扇,电源温度明显降低2-3度。对于服务器机箱散热风扇,选用风量大的风扇,效果更佳。最后,要合理设计风道。在安装好硬件后把机箱内的cable、电线整齐地扎好(如应用蛇皮网配合热缩套管能使机箱内部的布线更加有条理),以保证机箱内气流流通无阻。俗语云:“磨刀不误砍柴工”。要想服务器稳定工作,在这方面花点时间是值得的。
三、 主板
主板犹如人的骨架,承载着CPU、内存等重要组件的运行。如果服务器电源质量可靠,容量充足;机箱内散热良好,但仍偶尔会莫名其妙的当机,问题可能出自主板。有些主板在当机后,因有自我保护功能,必须关掉电源后再开机;更有甚者,必须清除CMOS中的记忆,才可重启。这对服务器的远程维护与管理造成严重障碍,所以选择优质的主板显得格外重要。INTEL主板是少数通过WHQL微软WINDOWS操作系统硬件质量认证的产品,稳定性和兼容性经受考验。在性能方面,INTEL原厂服务器主板配合自己的处理器,表现优异也就不奇怪了。虽然INTEL有为稳定性而牺牲性能的传统,但服务器首要的还是追求稳定,因此推荐大家采用INTEL主板。
四、主频不再作为CPU性能的衡量标准
众所周知CPU是服务器的心脏,一台服务器所使用的CPU基本决定其性能和档次。曾几何时我们以CPU主频(核心时脉频率)判断CPU性能的高低,Intel的CPU也以高主频策略占据了更多的市场。多年以来,Intel一直恪守着“摩尔定律”主频决定一切的原则,从MHz到GHz,工程师们最关注的就只有一件事:如何提高CPU的工作频率。随着CPU科技的不断发展,主频已经发展到近4GHz,晶圆制程也从180纳米、130纳米、逐步转到90纳米甚至65纳米。随着主频的提升,制程的缩小,CPU发热问题也越来越突出。近期Intel放弃了开发更高主频率的CPU,转向发展双核心甚至多核心CPU,主要是大功耗电晶体所带来的散热问题未能解决,所以4GHz Pentium(P4) CPU尙未推出市场。
五、散热问题成主频提升瓶颈
CPU是服务器的核心,也是“热心”(发热的中心),高温时CPU会自动将工作效率降低,所以CPU的温度对于其性能至关重要。然而解决CPU的散热问题谈何容易!试想当年的Pentium MMX 200MHz,用的只是一个小风扇。而现在的发烧友都在使用水冷、干冰制冷、甚至有些超频发烧友在使用液氮制冷,可见CPU的发热量增长是多么的大。随着集成的电晶体增多,CPU的功耗和发热量都增加了。按过去的经验,通过采用新的制造工艺,可以将功耗降下来。比如从180纳米过渡到130纳米之后,Tualatin核心比Coppermine核心的功耗有了明显的下降。但130纳米到90纳米,功耗递减的规律失效了。例如旧型130纳米P 4 3.2GC Northwood 才82W,新型90纳米P4 3.2GE Prescott功耗值达到103W。制程的缩小会减少CPU核心所占用的面积,但其他相关部件就可能会增大,而且这种减小与增大幷不是一个线性的关系。减小面积也需要降低晶片的工作电压,例如,130纳米的Hammer处理器其工作电压为1.5V,90纳米的Hammer需要在1.4V下工作,而90纳米的Prescott则只能在1.2V的电压下正常工作。一颗晶片的功耗由电路工作中产生的动态功耗以及由漏出电流造成的静态功耗构成。电压的降低意味着晶片的电晶体动态损耗会降低,但是减小面积的同时暂态泄漏电流就会增大,而且随着电晶体面积的减小,这个漏电电流会以几何级数增长。在以前的制造工艺中,漏电电流几乎可以忽略,比如在0.25纳米制程的晶片中,你几乎无法检测到漏电流的存在,但是到了90纳米时代,晶片的线宽缩小,电晶体的栅极变得越来越薄,漏出电流越来越大,所以漏电所造成的影响就已经成为电能消耗的首要因素,而同时也正是由此引发了发热过巨的大问题。制程的缩小使得CPU核心可容纳更多的电晶体,所以Intel在提升主频的同时也增加了L2缓存(Cache)数以提升整体性能。CPU的电晶体数目骤增导致了其总功耗的增长,这是CPU发热增长的第二个原因。Prescott的核心面积比Northwood小了25平方毫米,却比后者多容纳了7000万个电晶体!多出的7000万个电晶体工作时释放的热量可想而知。4GHz的Pentium4处理器,虽然主频是顶级,但是功耗却一定不低,据说满负荷工作会达到200W!我想这才是Intel放弃4GHz处理器发布计划的原因吧。
六、双核心架构及增加缓存成新宠
Intel将CPU的架构从单核心发展到双核心,主要是因为目前CPU运算核心发展已达极致,而依靠增加主频方式导致CPU发热量大增,性能却不见得同步成长。现在各个厂商都把提升CPU性能的希望寄托了在双核心甚至是多核心上,增加缓存(Cache)也是办法之一。谈到双核心处理器,相信不少朋友会问:双核心技术与超线程(Hyper-Threading)有何不同呢?毕竟以前Intel的P4利用超线程技术已经实现了“双核”的功用。从原理上来说,超线程技术可以让单CPU拥有处理多线程的能力,而物理上只使用一个处理器,但作业系统等软体将其识别为两个逻辑处理器。虽然支援超线程的P4能同时执行两个线程,但在执行多线程时两个逻辑处理器均只能交替工作,因此,超线程技术所带来的性能提升远不能等同于两个相同主频处理器带来的性能提升。如果要让处理器资源真正实现幷行处理模式,还需要处理器引入物理双内核设计!在作业系统看来,它是实实在在的双处理器,可以同时执行多项任务。理论上说,双核心处理器的性能几乎比单核心处理器高50%—70%。而且增加硬体核心幷不需要增加太多晶体管,也可通过削减二级缓存的容量以保持适当的电晶体规模,因此也不会带来过多的功耗负担。增加缓存也是近年来提升CPU效能的主要办法,但这样做会否增加CPU的功耗?研究发现,提高主频带来的功耗增加是以平方计算的,相比之下,增加缓存只会增加少许电压,如由1.4V提升到1.45V,电压的增加以倍数计算,容易控制。事实上在面临散热等问题瓶颈后,Intel已逐渐加大缓存容量以增加性能。不但P4处理器L2缓存由Northwood核心的512KB提升到Prescott核心的1MB后,又推出搭配2MB版本的6系列P4,平价处理器Celeron在导入Prescott核心后,L2缓存也从原本128KB加大到256KB。Intel新近推出处理器的顶级产品P4至尊版(P4EE,P4 Extreme Editon)3.46GHz主频、1066MHz 外频,更在其中加入了2MB L3 Cache。这种以前只是在XEON处理器上拥有的技术现在也已经走入平民化玩家层次,对于一般的服务器应用应有不少帮助。过去无论是Intel还是AMD都只是把Cache缓存的重点放在了L2 Cache上,容量一再进行提升。为了凸显P4 EE的与众不同,Intel赋予它多达2MB的三级缓存,加上512KB的二级缓存,P4 EE的缓存多达2.5MB,但L3 Cache到底有什么作用? 从处理器的工作原理来看,容量较小的L2缓存在纯数学运算中是肯定要快于容量较大的L3缓存的,而L3 Cache又远大于实体记忆体的资料交换速度。我们要注意Intel在P4 EE上的L3 Cache不仅仅是容量上单纯的提升,重要的是它的运行速度是和CPU外频一样的,最大程度的保证了CPU工作时和记忆体之间的资料交换速度,保证了单周期内和二级缓存之间的延时一致的,在资料的不断调用过程中幷不会因为延时的问题造成不必要的等待和性能损耗。
七、外频提升功耗不会显著增加
CPU性能的发挥,不单要看CPU主频及Cache大小,外频的影响也很关键,因为关系到CPU与RAM、显卡等设备交换资料的速度。例如: Intel最近推出P4 3.46GHz 主频(内频)、1066MHz外频的CPU,CPU实际执行频率(内频)3.46GHz =FSB 266.7MHz ×13倍频系数,外频1066MHz = FSB 266.7MHz ×4倍速度运作。提供8.5GB/s的频宽,可充分发挥Dual DDR2 533高频宽的优势,支持新一代的PCI-Express×16图像埠(其8GB/s频宽已经超出800MHz外频的极限)。虽然外频是如此重要,但要增加外频却比内频困难。Pentium处理器刚推出时,内外频都为66MHz,而现在P4内频 3.6GHz外频只有800MHz,可见CPU内频提升了54倍,外频只提升了12倍。外频提升困难主要是因为牵涉太多的设备,不像内频提升只考虑CPU内部的设计为主,且随着高外频出现的EMI(电磁干扰)问题,比较难以解决。Intel与AMD推出Differential Bus Clocking,取代Single End Clocking,令工作频宽更易提升。此外,AMD更引入DDR技术,其后Intel更有QDR技术,令外频在FSB 100MHz的时脉下,产生400MHz的资料传输效果。传统外频除了难以提升频率外,在读写效率方面亦然。现在的外频在读写资料时是单向的,而新一代的周边系统如PCI-Express显示卡已经提供同时上传、下载功能,所以AMD采用扩充性高的HyperTransport技术优化外频,令CPU对外频宽大大提升,在执行效率方面也比传统外频先进,可同时进行读取和写入工作,期间不用进行切换。Intel采用PCI-Express,亦可实现先进的双向传输功能,达到16GB/s以上的频宽,满足CPU对外频的要求。外频的增加会否增加功耗呢?从800MHz到1066MHz外频,Intel的P4 EE CPU功耗增加十分轻微。P4 EE 3.46GHz的功耗为110.7W,比P4 EE 3.4GHz的109.6W轻微增加1.1W,现在明白为何Intel刚放弃了4GHz主频而能马上推出更高外频的CPU了。
八、向65纳米制程迈进
目前Intel要确保其双核心计划能顺利实施有一个至关重要的前提——采用更先进的生产技术。多核心尽管带来了更为强大的性能,但是也同样加大了功耗。目前部分主流CPU已经使用90纳米工艺制程,但正如上文所述,功耗过高的问题未能解决,所以正加紧开发新的工艺制程,功耗过高的问题会渐渐改善。CPU的性能完全依赖于其内核晶片的电路结构,更高的性能意味着电路更加复杂精密。但如果工艺制程不改进,电晶体数量增加到8倍后,体积和功耗也增加到8倍(发热量也增到8倍),而可供散热的表面积仅增加到4倍。所以在不改变工艺制程的情况下单纯增加电晶体的数量是不可取的。Intel 65纳米工艺在单元尺寸不变的情况下,集成电晶体数目却超过了5亿个,其中1平方毫米大小的晶片上电晶体数目已经达到1000万个!决定CPU价格的主要因素是晶片的尺寸,技术的进步带来了性能的提升,但成本却可能更低。在开发65纳米工艺制程过程中,Intel最重视的一点就是在提高工作速度的同时降低泄漏电流以解决散热问题。为此,Intel在制造技术和电路技术方面均采取了降低泄漏电流的措施。在制造技术方面,通过采用90纳米工艺开始引进的“应变硅”核心技术而得以改善。具体而言,nMOS电晶体外形成了一层Si3N4膜,pMOS电晶体则在源极和漏极中采用了SiGe材料。由此就给电晶体沟道部分施加了拉伸应力,从而就能提高载流子的迁移率。结果,作为65纳米工艺,与不使用应变硅相比,可将工作速度提高约30%。另外,与90纳米工艺相比,65纳米工艺电晶体在工作速度相同的条件下,能够将泄漏电流减少到原来的1/4左右。 在电路技术方面,配置了一个用来切断泄漏电流流向缓存(SRAM)的开关。通过在SRAM元件与接地线之间插入nMOS开关电容器,切断空闲SRAM元件的电源。由此可将SRAM的泄漏电流降低到原来的1/3左右。
九、近期服务器CPU的选择建议
基于散热问题以及即将在2005年上市的双核心处理器进程影响,Intel已于近日正式宣布放弃4GHz Pentium(P4)处理器上市计划,并在11月1日已推出P4 EE 3.46GHz 主频,采用1066MHz外频、130纳米、内建2MB L3,而90纳米、2MB L2的Intel P4 EE则预计在2005年1季度推出。
随着制程技术的进一步提升,以双核心甚至多核心及加大L2/L3、外频及64bit来提高CPU性能,正成为当前服务器CPU发展趋势。目前准备更新服务器CPU的朋友,笔者建议仍采用价格适中的旧型130纳米P 4 3.2GC Northwood,待2005年下半年双核心65纳米制程推出如热量问题得到解决,2006年才是采用新CPU更新服务器的时候。