消息传递引擎启动失败时管理高可用性

如果尝试在服务器上启动消息传递引擎不成功,那么该服务器会作为该消息传递引擎要运行的位置被禁用。解决消息传递引擎无法启动的问题后,必须手动重新启用该服务器以维护高可用性环境。

关于此任务

在高可用性环境中,消息传递引擎可在多个应用程序服务器上运行。如果尝试在服务器上启动消息传递引擎不成功,或者主管正在运行的消息传递引擎的服务器停止,那么高可用性管理器会在另一符合资格的服务器上重新启动消息传递引擎。如果高可用性管理器不能在该服务器上启动消息传递引擎,那么该服务器将作为该消息传递引擎要运行的位置被禁用,并且会在 JVM 日志中针对该服务器生成以下消息:
CWSID0039E: HAManager-initiated activation has failed, messaging engine messaging_engine_name will be disabled

在某些情况下,消息传递引擎启动可能会重复失败。在以下示例中,包含三个服务器的集群主管的消息传递引擎配置为使用数据存储器。该集群会在主管数据存储器的数据库启动之前启动。该消息传递引擎尝试在 server1 上启动,并且在缺省情况下会尝试连接至数据存储器最长 15 分钟。

此图像在周围文本中做了说明。
因为未启动数据库,所以消息传递引擎不能连接至数据存储器。消息传递引擎启动失败,并且对 server1 禁用高可用性。消息传递引擎故障转移至 server2,然后重试启动并连接至数据存储器。
此图像在周围文本中做了说明。
如果数据库仍未启动,那么消息传递引擎会启动失败,并且对 server2 禁用高可用性。消息传递引擎故障转移至 server3,然后重试启动并连接至数据存储器。
此图像在周围文本中做了说明。
如果数据库仍未在运行,那么消息传递引擎启动失败,并且对 server3 禁用高可用性。现在已对集群中的所有服务器禁用高可用性,直到您启动数据库并重新启用至少一个服务器,消息传递引擎才能启动。

当您修正导致消息传递引擎启动失败的原因时,通过重新启动服务器或遵循此任务中的步骤使用管理控制台启用它们对服务器重新启用高可用性。

过程

  1. 浏览至管理控制台中的高可用性组面板以显示高可用性组列表。 请参阅Viewing high availability group information,以了解详细信息。
  2. 查找并单击列表中的相关高可用性组。 要查找相关组,请查找作为名称/值对包含在组名中的总线和消息传递引擎名称。例如,带有以下名称的组包含正在集群 MyCluster 的总线 MyBus 上运行的消息传递引擎 MyCluster.000-MyBus:
    IBM_hc=MyCluster, WSAF_SIB_BUS=MyBus,WSAF_SIB_MESSAGING_ENGINE=MyCluster.000-MyBus,type=WSAF_SIB

    将显示对应该组的面板,该面板显示与消息传递引擎集群中每个正在运行的服务器相关联的高可用性状态。如果服务器处于禁用状态(由红色方框指示),那么会损害环境的高可用性,原因是消息传递引擎无法在该服务器上启动。如果所有服务器都处于禁用状态,那么直到您启用至少一个服务器,消息传递引擎才能启动。

  3. 选择处于禁用状态的所有成员并单击启用

下一步做什么

使用数据存储器的消息传递引擎故障转移至另一应用程序服务器时,它可能会尝试在数据库服务器检测到与原始应用程序服务器的网络连接断开之前启动。因为数据库服务器未检测到连接断开,所以不会释放数据存储器表锁定并且消息传递引擎不能启动。在此情况下,消息传递引擎可能会在集群中的所有服务器上启动失败。为避免此问题,请调整系统以更加迅速地检测连接断开。


指示主题类型的图标 任务主题



时间戳记图标 最近一次更新时间: last_date
http://www14.software.ibm.com/webapp/wsbroker/redirect?version=cord&product=was-nd-mp&topic=tjt_managing_ha
文件名:tjt_managing_ha.html