威尼斯手机娱乐官网:避免草木皆兵,群集服务
分类:网络运维

现在的服务器都配置了成堆的传感器,一旦任何传感器发生状况都会发出告警,令人头昏目眩。但是管理员必须尽早知道:服务器监控工具产生的告警不一定都重要。如果服务器动辄发出警报,那你会在短时间内被迫接收大量信息,其中真正重要的信息可能会被淹没。本文的目的就是帮助管理员认清哪些服务器告警是重要的,管理员需要服务器监控工具怎样正确提供警报。

摘要
本循序渐进提供在运行 Windows® 2000 Advanced Server 和 Windows 2000 Datacenter Server 操作系统的服务器中安装群集服务的操作方法。本指南还介绍在群集节点上安装群集服务的步骤。本指南不准备讲述如何安装群集应用程序,而是指导您完成一个典型的、两节点群集的安装过程。
引言
服务器群集是一组各自独立的服务器,这些服务器运行群集服务并作为一个系统共同工作。服务器群集将多个运行 Windows 2000® Advanced Server 或 Windows 2000 Datacenter Server 的服务器放在一起,从而使得资源和应用程序的可用性、可伸缩性和易管理性得以大大改善。
服务器群集的目的是在发生故障和计划停机时保持客户机对应用程序和资源的访问。如果群集中的一台服务器由于发生故障或需要维护而无法使用,资源和应用程序将转移到另一个有效的群集节点中。
对于群集系统,使用术语“高可用性”,而不是使用“容错”,因为容错技术提供更高级的恢复力和修复功能。容错服务器通常使用高度冗余的硬件再加上专门的软件,使系统从任何一个硬件或软件故障中瞬时得以恢复。这些解决方案的费用比群集解决方案要高得多,因为各单位必须为冗余硬件支付费用,这些冗余硬件平时都处于闲置状态,只有发生错误时才能一展身手。容错服务器用在交易价值较高、速率较快的应用场合:如票据交换所、自动提款机 (ATM) 或证券交易所。
虽然群集服务不能保证运行不会停止,但它却为大多数关键的应用程序提供了足够的可用性。群集服务可以监视应用程序和资源,自动识别大多数故障,并进行恢复。这样,可以大大增强管理群集内工作负荷的灵活性,系统的总体可用性也有所提高。
群集服务的优点包括:
可用性高。有了群集服务,诸如磁盘驱动器和 IP 地址之类的资源所有权会自动从发生故障的服务器转移到未发生故障的服务器。当群集中的某一系统或应用程序发生故障时,群集软件在未发生故障的服务器上重新启动已发生故障的应用程序,或将工作从故障节点分散到其余节点上。结果,用户只感觉到服务有瞬间的停顿。
故障回复。当故障服务器回到联机状态时群集服务自动重新平衡群集中的工作负荷。
易管理性。您可以使用“群集管理器”将群集作为一个系统来管理,对应用程序的管理也与它们运行在一台服务器中没有什么区别。您可以通过拖放群集对象来将应用程序在群集内的不同服务器之间移动。您还可以用同样的方式在不同的服务器之间移动数据。这种方法可用来手动平衡服务器的工作负荷,并且能够卸载其工作负荷,以便进行有计划的维护。您还可以从网络中的任何位置监视群集、所有节点以及资源的状态。
可伸缩性。对群集服务可以进行扩展,以便满足不断增长的需求。当一个支持群集的应用程序其总体负荷超过群集本身的能力时,就可以添加更多的节点。
本白皮书提供在运行 Windows 2000 Advanced Server 和 Windows 2000 Datacenter Server 的服务器上安装群集服务的操作指南。它介绍在群集节点上安装群集服务的过程。它不准备讲述如何安装群集应用程序,而是指导您完成一个典型的、两节点群集的安装过程。
群集服务器安装的核对清单
本核对清单可帮助您为安装作好准备。在核对清单之后就是我们的分步操作指南。
软件要求
在群集中的所有计算机上安装 Microsoft Windows 2000 Advanced Server 或 Windows 2000 Datacenter Server。
名称解析方法,如域名系统 (DNS)、Windows Internet 命名系统 (WINS)、HOSTS 等。
推荐使用进行远程群集管理的终端服务器。
硬件要求
群集服务节点的硬件必须符合 Windows 2000 Advanced Server 或 Windows 2000 Datacenter Server 的硬件要求。这些要求可以在产品兼容性搜索页中找到。
群集的硬件必须在群集服务硬件兼容列表 (HCL) 上。可以访问 Windows 硬件兼容列表,然后在“群集”中搜索,找到最新版本的群集服务 HCL。
两台符合 HCL 的计算机,每台计算机的配置如下:
安装了 Windows 2000 Advanced Server 或 Windows 2000 Datacenter Server 的启动磁盘。该启动磁盘不能位于下面介绍的共享存储总线中。
用于共享磁盘的、单独的 PCI 存储主机适配器SCSI 或光纤信道) 它是对启动磁盘适配器的补充。
群集中的每台机器上安装两个 PCI 网卡。
一个与所有计算机连接的、符合 HCL 的外部磁盘存储器单元,它将用作群集磁盘。推荐使用独立磁盘冗余阵列 (RAID)。
连接共享存储设备与所有计算机的存储电缆。配置存储设备时要参考制造商的操作指南。如果使用 SCSI 总线,请参见附录 A 以获得更多的信息。
威尼斯手机娱乐官网 ,所有硬件都应该是相同的,插槽对插槽、卡对卡。这样做将简化配置过程,并能消除潜在的兼容性问题。
网络要求
唯一的 NetBIOS 群集名称。
五个唯一的静态 IP 地址:两个用于专用网络的网卡,两个用于公用网络的网卡,还有一个用于群集本身。
用于群集服务的域用户帐户所有节点必须是同一域的成员)。
每个节点都应该有两个网卡 - 一个用于连接公用网络,另一个用于节点对节点的专用群集网络。如果两种连接只采用一个网卡,那么这种配置得不到支持。HCL 证书要求有单独的专用网络适配器。
共享磁盘要求:
所有的共享磁盘包括仲裁磁盘)必须实际与共享总线连接。
验证与共享总线连接的那些磁盘是否可以从所有节点看到。这可以在主适配器安装级别进行检查。请参考制造商的文档以查找具体适配器的操作指南。
根据制造商的操作指南,必须为 SCSI 设备分配唯一的 SCSI 标识号,并且正确地进行端接。1
必须将所有的共享磁盘配置为基本不是动态)配置。
必须将磁盘上的所有磁盘分区格式化为 NTFS。
尽管不作要求,但对于所有的磁盘还是强烈推荐使用容错 RAID 配置。这里的关键概念是容错 RAID 配置 - 而不是没有奇偶校验的条带集。

配置告警机制的技巧

本循序渐进提供在运行 Windows 2000 Advanced Server 和 Windows 2000 Datacenter Server 操作系统的服务器中安装群集服务的操作方法。本指南还介绍...

在开始之前,我想先指出一点:配置告警并没有绝对正确或错误的方法。本文中的建议主要基于我二十年的IT经验,但它们终归是我个人的偏好。所以,虽然希望你们能从我的建议中获取好处,但我更建议每个管理员配置服务器告警时,尽量紧贴与自己公司的特定要求。

另一点我要指出的是:管理员可以用很多方法让服务器产生告警。有的服务器可以在硬件级产生告警,这虽然很有用,但还远远达不到作为独当一面的告警机制的要求。服务器供应商提供的服务器监控工具有大量信息,作为操作系统级的服务器监控工具,比如微软的System Center Operations Manager。因为监控工具的选择很多,我会普遍地讲一讲,而不是单独讲某个特定的工具。

为服务器告警机制配置优先级

想让服务器监控变得有效,关键在于对监控工具的告警机制进行优先级配置。我推荐把告警分为高级、中级、低级三种。

我通常把优先级高的告警定义成最最关键的事务。比如,服务器磁盘空间全部耗尽就是一个关键事件,同样一个群集化应用服务器出现故障也会酿成大祸。

中级优先级的告警比较难以定义。我所认为的中级告警可能对于其他组织来说是高级的。对我来说,如果警报中的问题不会带来整体停机,那么优先级就是中级。比如说一个群集中的某个节点不知道为什么断电了,但不会影响整个群集的运行,那我就把它定义为优先级中级。当然这和所处的工作环境有很大关系。我任职过的一些大公司就把这类问题定义为关键事务。

但是,如果你的公司不能容忍任何宕机事件发生,那比较聪明的方法就是根据问题是否有发生故障的潜在风险来决定优先级。比如说你有一个RAID列阵,能够在不离线的情况下处理两个磁盘的失误,那如果其中一个故障了,你可以把这件事当成中等优先级的告警,因为该阵列还能正常处理另一个磁盘的故障。但如果两个磁盘都发生故障,那就是高等优先级了,因为如果还有一个磁盘故障,那整个阵列就完了。

本文由威尼斯手机娱乐官网发布于网络运维,转载请注明出处:威尼斯手机娱乐官网:避免草木皆兵,群集服务

上一篇:威尼斯手机娱乐官网:系统管理员如何保障服务 下一篇:没有了
猜你喜欢
热门排行
精彩图文