[AIX Solaris HP-UX Linux Windows][z/OS]

Intelligent Management:应用程序布置常见问题解答

有时,可能会遇到意外的应用程序布置行为。本主题描述了当应用程序布置未按照预期方式工作时要查找的一些常见问题解答和事宜。

应用程序布置控制器在哪里运行?

要查找应用程序布置控制器运行的位置,可使用管理控制台或脚本。要检查管理控制台中的位置,请单击运行时操作 > 组件稳定性 > 核心组件。您还可以运行 checkPlacementLocation.jacl 脚本来显示应用程序布置控制器运行所在的服务器。

应用程序布置控制器何时启动服务器?

应用程序布置控制器因下列原因启动服务器:
  • 达到为动态集群定义的最低数量的应用程序实例。
  • 为停用动态集群通过随需应变路由器路由请求时。
  • 动态集群可从附加容量受益时。自主请求流管理器发送的信号指示如何才能有利于动态集群获得更多附加容量和为动态集群启动的附加实例。
要获得应用程序布置控制器的视图中运行的视图内容,请参阅 SystemOut.log 消息。

应用程序布置控制器何时停止服务器?

应用程序布置控制器因下列原因停止服务器:

  • 节点上存在内存约束。应用程序布置控制器理解最少的动态集群或该动态集群所需的容量及系统的处理器约束和内存约束。如果节点上的可用内存较低,那么应用程序布置控制器会试图停止实例尝试阻止节点进行交换。
  • 将动态集群配置为应用程序迟钝启动和主动空闲停止,且对动态集群没有任何需求。如果动态集群没有任何需求,那么应用程序布置控制器会尝试停止该集群的实例,以消除不活动动态集群的资源消耗。

应用程序布置控制器为什么不启动服务器?

应用程序布置控制器因下列其中一个原因而不显示服务器已启动:

  • 该配置未启用动态应用程序布置:
    1. 验证是否启用了布置控制器。在管理控制台中,请单击运作策略 > 自主管理器 > 应用程序布置控制器
    2. 验证主体集集群是否为动态集群。应用程序布置控制器仅对动态集群予以处理。在管理控制台中,单击服务器 > 动态集群。检查每个主体集群的操作方式字段是否为自动。如果不是,那么选择动态集群并单击自动。为动态集群选择“自动”后,请单击设置方式
    3. 验证已配置“布置更改之间的最短时间”参数的值是否未设置得太高。在管理控制台中,单击运作策略 > 自主管理器 > 应用程序布置控制器。将布置更改之间最短时间字段的值设置为合适的值。可接受的值范围介于 1 分钟到 24 小时之间。
  • 服务器操作超时值设置过低。

    有时,应用程序布置控制器不启动服务器,因为该服务器操作超时。在管理控制台中发生超时之前可配置时间量。单击运作策略 > 自主管理器 > 应用程序布置控制器。编辑服务器操作超时字段。如果您的单元大而系统慢,或系统承担过高的工作负载,那么将此字段设置为较高的值。此值表示每台服务器启动的时间,但根据单元中的服务器数量会发生超时。例如,如果您有 5 台服务器,且将值设置为 10 分钟,那么在 50 分钟后会发生超时。

  • 没有足够的内存可用:
    • 您可以通过查看 SystemOut.log 文件中失败的启动,来诊断何时没有足够的可用内存。
    • 应用程序布置控制器使用下列公式计算动态集群成员的内存消耗:
      • 如果没有正在运行的其他动态集群实例(冷启动):
        Server memory consumption = 1.2*maxHeapSize + 64 MB
      • 如果其他动态集群实例正在运行,那么应用程序布置控制器内存概要分析程序会使用以下公式:
        Server memory consumption = .667*resident memory size + .333*virtual memory size
    • 当应用程序布置控制器重新启动时,内存概要文件不是持久性文件。
    如果您要调试,那么可通过将 memoryProfile.isDisabled 定制属性设置为 true 来禁用应用程序布置控制器内存概要分析程序。
查看失败启动的信息
切记: 当应用程序布置控制器重新启动或在节点之间移动时,失败启动列表不是持久性列表。
可以使用下列其中一个选项查看失败启动信息:
  • 使用 PlacementControllerProcs.jacl 脚本可查询失败服务器操作。
    运行以下命令:
    ./wsadmin.sh -profile PlacementControllerProcs.jacl -c "anyFailedServerOperations"
  • 使用 wsadmin 工具中的命令可显示失败启动。
    例如,可运行下列命令:
    wsadmin>apc = AdminControl.queryNames('WebSphere:type=PlacementControllerMBean,process=dmgr,*')
    wsadmin>print AdminControl.invoke(apc,'anyFailedServerOperations')
    服务器可用时,可移除失败的启动标志。可使用以下 wsadmin 工具命令来列示启用失败启动标志的服务器:
    wsadmin>print AdminControl.invoke(apc,'anyFailedServerOperations') OpsManTestCell/xdblade09b09/DC1_xdblade09b09
  • 查看 SystemOut.log 文件中的失败启动。

为什么应用程序布置控制器启动的服务器超过了预期?

当网络或通信问题阻止应用程序布置控制器接收服务器启动的确认时,可启动超过预期的服务器。当应用程序布置控制器不接收确认时,可能要启动其他服务器。

为什么应用程序布置控制器提交了多个用于启动同一服务器的任务?

此行为的原因可能是应用程序布置控制器在多个服务器上运行。此情况通常出现在混合拓扑中,其中 WebSphere® Application Server V8.5 单元还包含 WebSphere Virtual Enterprise V6.1.x 节点。应用程序布置控制器在以下两个节点上运行:WebSphere Application Server V8.5 节点和 WebSphere Virtual Enterprise V6.1.x 节点。在缺省情况下,WebSphere Application Server V8.5 和 WebSphere Virtual Enterprise V6.1.x 节点使用不同的高可用性解决方案。因此,将运行多个应用程序布置控制器。要修正此问题,请在 Deployment Manager 上运行 useBBSON.py 脚本,然后重新启动单元。该脚本设置单元定制属性以确保在整个单元中使用同一个高可用性解决方案,并且仅启动一个应用程序布置控制器。

我如何知道应用程序布置控制器何时已完成某个操作,或即将完成某个操作?

您可以使用运行时任务检查应用程序布置控制器的操作。要查看运行时任务,请单击系统管理 > 任务管理 > 运行时任务。运行时任务的列表包括完成应用程序布置控制器的任务及所作更改的确认。每个运行时任务都有一个成功、失败或未知的状态。未知状态表示没有任务是否成功的确认。

应用程序布置控制器如何与 VMware 配合工作?支持哪个硬件虚拟化环境?

有关应用程序布置控制器如何与 VMware 及其他硬件虚拟化环境配合工作的更多信息,请阅读“虚拟化和 Intelligent Management,及受支持的服务器虚拟化环境”。

如何在不影响应用程序布置控制器的情况下启动或停止服务器?

如果动态集群在自动方式下时启动或停止服务器,那么应用程序布置控制器可能会决定更改您的操作。要在启动或停止服务器时避免影响应用程序布置控制器,请在启动或停止服务器前将动态集群置于手动方式。

在异类系统(混合硬件或操作系统)中,应用程序布置控制器如何选择启动服务器的位置?

动态集群的成员资格策略定义启动服务器所在的合格节点。在这组节点中,应用程序布置控制器通过考虑系统约束(例如可用的处理器和内存容量)来选择要在其上启动服务器的节点。应用程序布置控制器并非根据操作系统来确定服务器布置。

当动态集群处于负载下时,应用程序布置控制器何时启动另一服务器?

应用程序布置控制器与自主请求流管理器 (ARFM) 和定义的服务策略配合使用,来确定何时启动服务器。服务策略为应用程序设置最高的性能和优先级,并指导自主控制器在通信量塑形和容量供应方面制定决策。服务策略目标间接影响由应用程序布置控制器采取的操作。应用程序布置控制器根据来自 ARFM 有关 ARFM 队列维护的并行请求数据所需多少容量的信息可提供更多服务器。此数量根据每个请求在提供服务时使用多少容量,及 ARFM 确定需要多少并行请求来确定。并行请求的数量基于应用程序优先级、目标等。

不保证由服务策略定义的性能目标。Intelligent Management 无法使您的应用程序响应速度超过其限制。另外,如果已提供可满足需求的足够容量,那么不再提供更多容量,即使突破服务策略的目标也是如此。Intelligent Management 可阻止不实际的服务策略目标将不稳定性因素带到该环境中。

应用程序布置控制器如何确定服务器的最大堆大小?

可以在动态集群模板中更改服务器的堆大小。有关更多信息,请阅读“修改 JVM 堆大小”。

为什么动态集群成员未继承模板的属性?

更改服务器模板前,必须将动态集群保存到主存储库。如果您的动态集群成员未继承模板的属性,那么可能会在未保存的工作空间中对服务器模板进行更改。要解决此问题,请删除然后重新创建该动态集群。

将更改保存到主存储库。单击完成后,单击消息窗口中的保存,可以确保将更改保存到主存储库中。在保存到主配置窗口中再次单击保存。单击与节点同步更改

为什么我的动态集群中活动服务器太少?

如果遇到动态集群中没有足够的服务器在运行这样的问题,请尝试执行以下操作:
  • 当节点组中的节点未得到高度利用时,请验证是否满足了服务策略。有时,可能未清楚地定义策略,虽然系统能够满足此策略,但还是不能满足您的需求。要在管理控制台中检查或更改服务策略,请单击运作策略 > 服务策略 > 选择现有策略。检查策略的目标类型、目标值和重要性,然后作出任何必要的更改。
  • 当节点组中的节点已高度利用时,请将此集群的服务策略目标与其他活动集群的服务策略目标相比较。如果属于此集群的流量与属于其他集群的流量相比,前者的重要性较低或者目标服务目标较松,那么很可能是系统为此集群实例化的服务器要少一些。要在管理控制台中检查或更改服务策略,请单击运作策略 > 服务策略 > 选择现有策略
  • 如果节点组似乎有额外的容量,但您的服务策略未得到满足,请检查动态集群上的配置设置。可能由于 maxInstances 策略设置的问题而创建了过少的动态集群实例。

在动态集群环境中,应用程序布置控制器为什么无法跨节点分发可用的服务器?

动态应用程序布置功能基于负载分布、服务策略和可用资源。在动态集群中减少最大数量的应用程序实例时,应用程序布置控制器会停止具有最高工作负载的节点上的服务器,直到服务器数量减少到设置的最大值。如果所有节点都可用,那么应用程序布置控制器会选择列表上的第一个节点,然后继续选择下一个节点,直到达到最大数量。

在相同节点上运行的多个动态集群中减少最大数量的应用程序实例时,会应用相同的进程:应用程序布置控制器停止每个动态集群中的服务器,直到服务器的数量达到每个动态集群的最大设置数量为止。因为每个动态集群中的所有服务器都在相同的节点上运行,所以停止服务器的节点选择顺序与每个动态集群相同。
注: 如果至少一个节点在负载下,那么应用程序布置控制器会启动更多分发的布置解决方案。

指示主题类型的图标 参考主题



时间戳记图标 最近一次更新时间: last_date
http://www14.software.ibm.com/webapp/wsbroker/redirect?version=cord&product=was-nd-mp&topic=rwve_odappfail
文件名:rwve_odappfail.html