联系我们

Contact
厦门唯友峰机电设备有限公司
电话:0592-2205670
传真:0592-2202290
营销部:18965130041  (王先生)
地址:厦门市软件园三期诚毅北大街51号302单元
邮箱:xmwyfjd@163.com

当前位置:首页> 新闻资讯

消除数据中心热点的各种技术措施

* 来源: * 作者: * 发表时间: 2020-01-01 1:39:46 * 浏览: 12
数据中心运维人员已采取各种措施消除热点。有些是有效的,可以在短期内解决问题,但它们也会导致能耗增加。有些措施不仅无法奏效,而且还会引起更多的热点。气流管理是一种简单,容易且具有成本效益的热点解决方案,它不仅可以一劳永逸地消除热点,还可以减少能源消耗并避免由于冷却单元数量增加而产生的相关成本。该研究探索了热点的根本原因,介绍了识别热点的方法,评估了典型的对策,并解释了消除热点的新技术和方法。 UptimeInstitute进行的一项调查显示,多达十分之一的机柜在高于设备可靠性准则建议的允许范围内的温度下工作。目前,数据中心机架的功率密度在不断提高,每个机架的平均功率密度为5kW或更高。因此,可以预料的是,受热点影响的机架数量将每天增加,并很快会超过上述比率。如果无法长期消除热点,则可能随着时间的流逝而造成严重威胁,不仅危及IT设备的可靠性和性能,而且会影响硬件制造商的保修或维护协议。因此,数据中心运维人员需要及早采取有效措施,避免此类风险。 1什么是热点?许多IT专业人员经常检查热通道的温度,或检查冷通道位置错误的温度。一旦发现温度过高,他们就会认为自己找到了热点。然后,他们将采取各种对策,但结果可能令人失望。它们会触发更多的热点,而不是消除热点。弄清热点是什么,热点的根本原因以及如何识别热点对于消除它们至关重要。 (1)热点的定义不要将在数据中心中随机测量的任何高温点都视为热点。我们将热点定义为:当IT设备的进气口温度高于ASHRAETC9.9建议的推荐值时,将其视为热点。一般机柜顶部的位置最容易产生热点。美国供热,制冷和空调工程师协会(ASHRAE)的热量指南给出了服务器进气口温度的建议值和允许范围。 (2)热点的根本原因:数据中心中安装的制冷设备的制冷能力经常供不应求,尤其是当制冷能力完全由IT设备“铭牌”上的额定值确定时。如果是这样,为什么还有热点?原因是热点不是由冷却能力不足或热负荷过大引起的,而是由于冷却能力未得到充分利用。换句话说,冷却能力足够,但是由于缺乏气流管理,未能在需要冷却的区域提供足够的冷却能力。图1是制冷量利用不足的示例。这是施耐德电气的真实案例研究。该图显示了一个传统的典型数据中心,具有房间级制冷功能,高架地板和吊顶用作供气和回风通道。计算机室中的空调首先以一定的压力和速度将冷空气送入地板过道。然后,冷空气从地板通道通过活动地板中的穿孔地板进入IT空间(即泄漏的空气)(占计算机机房中空调空气流量的54%),并且电缆在地板上被切断(占机房空调气流的46%)。地板上的电缆切口泄漏的气流将导致冷却能力下降,因为气流无法到达IT设备的正面,而是绕过了设备。实际上,这些气流并没有带走任何热量,而是循环回制冷装置。大部分通过穿孔地板的空气流(占穿孔地板空气量的96.29%)流经设备。在IT机柜中,但是由于缺乏气流管理,并非所有气流都通过设备。少量冷空气(占穿孔的地板空气量的3.71%)绕过IT设备并返回到冷却单元。像泄漏气流一样,这些旁路气流也会导致冷却能力的损失。同时,某些“急需的” IT设备无法获得足够的冷却能力,必须吸入从机柜背面排出的热空气(占IT气流的7.15%)。 IT设备在其前面创建热点。简而言之,采取减少空气泄漏,旁路和再循环的措施将有助于消除热点。 3(3)如何识别热点尽早发现热点对于防止IT设备过热和故障很重要。我们可以通过以下三种方式找到热点:①最简单,最经济的热点检测方法是来回巡视数据中心,将手放在机柜的前部并感觉到温度。如果温度高,则有热点。该方法的精度最差,但是对于极其明显的热点非常有效。 ②手动测量方法更准确,因为仪表可以更精确地测量温度值。此类仪器包括塑料温度棒,测温枪和FLIR热像仪。手动测量被认为是一种经济有效的热点检测方法。尽管当今的热像仪价格高达300美元。数据中心的操作和维护人员可以使用这些仪表来测量服务器进气口和机柜前门的温度,并测量服务器进气口和机柜前门之间的温差。空气出口(即服务器的ΔT)以查找热点。 ③自动监视称为热点识别方法,它可以显示实时数据并解释服务器或数据中心的冷却状态。数据中心物理基础架构管理(DCIM)解决方案的自动监视设备可以在系统达到特定阈值时通过电子邮件或短信向相关人员发送实时警报。借助DCIM软件,您可以根据自己的特定要求查看每个设备的进气口和出气口的实际温度。施耐德电气的StruxureWareTM是一种典型的数据中心基础架构管理软件。它可以使用从已安装的传感器网络收集的实时数据来提供详细的三维热图。这种方法有一定程度,但成本也很高。此外,IT设备通常配备有内置热传感器,该传感器可以监视其热状态并使用IPMI协议报告热点。其他有助于识别或防止潜在热点的建议包括使用计量机架式PDU识别和检查高密度(功率密度高于5kW)的机柜,这些机柜更容易出现热点。在决定移动,添加和更改机柜操作后,或者在数据中心设计阶段,请使用CFD软件预测热点。 CFD仿真技术可以对机柜前部的温度和压力云以及机柜周围的气流分布进行详细的三维分析,以发现潜在的热点。该工具的强大功能是,您可以找出浪费的冷却能力以及冷热气流的混和情况,从而导致冷却能力的利用不足。 2评估所采用的传统措施当发现热点时,数据中心运维人员将采取各种对策。但是,并非所有措施都能奏效。以下各节介绍了一些传统的对策,并说明了其为何有效/无效。请注意,大多数措施无助于减少旁路或再循环。 (1)可以说降低冷却装置的温度设置和降低送风温度将有助于减少热点,但这是处理热点的最后手段,因为这会降低整体效率和容量。制冷系统。此方法的效果取决于计算机房中空调的工作状况。如果制冷系统仍有容量过剩(即工作负荷小于100%且未达到制冷极限),那么降低温度设定值的方法将起到积极作用。适用于电脑中空调附近的热点降低机房温度设置可以降低热点温度。但是,如果机房空调在满负荷(满负荷100%)下运行,由于系统已达到冷却极限,因此降低温度设置值没有任何效果,因此无法消除热点。在给定的环境条件下,每个制冷系统具有固定的制冷能力。降低温度设定值后,“”的冷却能力也会降低。 (2)将穿孔地板放在热通道中。有人认为此方法不错,因为他们不了解冷通道/热通道布局设计的优势,并将所有高温现象都视为热点。实际上,这种方法不仅可以消除冷通道中的热点,还可以触发更多的热点。此外,将穿孔的地板放在热通道中(即导致气流绕过)会减少可用的冷却量。冷通道/热通道布局设计是最有效的方法,因此,热通道中根本没有热点。由于冷通道是IT设备获得冷却能力的“冷容器”,因此对于IT设备而言,保持冷通道中的低温非常重要。在以空气冷却的大型设备盛行的早期,通常通过高架地板提供制冷能力,并根据回风温度控制制冷单元。此方法之所以有效,是因为室内空气温度均匀且冷热气流完全混合。如今,在冷通道/热通道的布局设计中,故意建立两个冷热区,以形成不均匀的回风温度。习惯于统一室内温度设计的人可以将穿孔的地板放在热通道中,认为这可以解决热点。 (3)将机柜和多孔地板放在靠近制冷单元的地方。有人认为将机柜和多孔地板放置在尽可能靠近制冷单元的位置是很好的。更大的冷却能力。实际上,效果恰恰相反。这可能会导致IT设备散热不足,并且无法持续消除热点。尽管这种方法可以帮助收集大部分热量,但它是不可预测的,也不是解决热点的有效方法。这种方法导致IT设备冷却不充分的原因是,从制冷单元发出的气流速度很高,这会导致该区域的静压非常低。也就是说,安装在该区域中的多孔地板的散热量很小,甚至可能会将空气从房间吸入地板通道。确定活动地板下的气流是否存在问题的一种简单方法是在穿孔地板上方放置一小块纸。如果将纸张吸入穿孔地板,则应将穿孔地板换成坚固的地板,以平衡高架地板下过道的压力。 (4)将落地风扇放在热点机柜的前面。有人认为这可以将气流直接集中在热点的前面,因此这是消除热点的好方法。但是,此方法只能在紧急情况下临时使用,例如IT设备将要发生冷却故障时。这种方法可以降低设备的工作温度并消除热点,但是成本非常高。落地式风扇的功能基本上等同于气流混合器,将设备排出的热空气和冷空气混合,从而使气流温度介于低送风温度和高排风温度之间。这也将增加通过设备的气流。冷热空气的混合还会降低制冷系统的效率,导致增加的除湿/加湿负担,制冷系统容量的利用率不足,以及由于制冷冗余而可能造成的损失。此外,落地风扇将成为数据中心的附加热源。 (5)将气流吹到冰上,然后送入冷通道。有人认为,用冰冷却是一种简单的方法。尽管此方法有助于缓解热点,但冰融化时会变成水,这可能会使容器溢出并造成严重后果。即使装满冰块对于自行车,此方法不是最佳解决方案,因为有许多更简单有效的方法。我们将在下面详细讨论这些方法。 (6)推入便携式冷却装置。有人认为这是解决问题的好方法,因为此操作可以将冷风直接集中在热点前面。但是,此方法只能在紧急情况下临时使用,例如当IT设备将要遇到冷却中断时。不幸的是,这种方法经常被用作性解决方案。便携式制冷设备通常用于丢失制冷的紧急情况,因为数据中心人员可以轻松地将其推入到位。但是,对于如何正确解决整个数据中心的热点问题,下面讨论的方法是性解决方案,它不仅便宜而且非常有效。