![[AIX Solaris HP-UX Linux Windows]](../images/dist.gif)
![[z/OS]](../images/ngzos.gif)
运行状况管理
借助运行状况监视和管理子系统,可采取策略驱动的方法来监视应用程序服务器环境,并在发现特定条件时执行相应的操作。
运行状况监视与管理子系统
运行状况管理子系统持续地监视环境中服务器的状态以及由这些服务器执行的工作。运行状况管理子系统包含两个主要元素:运行状况控制器和运行状况策略。
运行状况控制器是控制运行状况监视和管理子系统的自主管理器,并且按照运行状况策略执行操作以确保特定条件存在。运行状况控制器是由高可用性管理器管理的分布式资源,并存在于所有 Node Agent 和 Deployment Manager 进程中。运行状况控制器在其中的一个进程中处于活动状态。如果活动进程失败,那么运行状况控制器会在另一个 Node Agent 或 Deployment Manager 进程上处于活动状态。
运行状况控制器在控制周期上运行。控制周期长度定义由运行状况控制器启动的环境检查之间的时间。在控制周期结束时,运行状况控制器会检查该环境,并生成运行时任务来解决运行状况条件中任何违规问题。
可定义运行状况策略,包括您要在环境中监视的运行状况条件及这些条件未得到满足时要采取的运行状况操作。
可以使用运行状况控制器来禁用或启用运行状况管理,同时仍在系统上定义了多个运行状况策略。可以限制服务器重新启动的频率或禁止在特定周期期间重新启动。
当 Intelligent Management 处于自动或受控操作方式时,运行状况管理子系统将正常工作。如果对策略的反应方式已设置为自动,那么当运行状况管理系统检测到运行状况策略违例时,将执行相应的操作。在受控方式下,运行状况管理系统将创建提供一种或多种反应的运行时任务。系统管理员可以核准或拒绝建议的操作。
运行状况条件
- 基于时效的条件
- 跟踪服务器运行的时间。如果时间超过定义的阈值,那么运行状况操作会运行。
- 超出请求超时条件
- 指定可超时的 HTTP 请求的百分比。当请求的百分比超过定义的值时,运行状况操作将运行。超时值取决于您的环境配置。有关超出请求超时运行状况条件的更多信息,请参阅超出请求超时运行状况策略目标超时值。
- 超过响应时间条件
- 跟踪完成请求的时间。如果时间超过定义的响应时间域值,那么运行状况操作会运行。注意: 超过超时阈值的任何请求都不会包括在超出响应时间计算中。例如,如果 60 秒的缺省超时值生效,那么超过该阈值 和超时的任何请求都不会包括在超出响应时间的计算中。即使您没有在环境中定义超出请求超时运行状况条件,此限制也同样适用。
- 内存条件:超出内存使用率
- 跟踪成员的内存使用率。当内存使用率在指定时间内超过堆大小的百分比时,可执行运行状况操作运行来纠正这种情况。
- 内存条件:内存泄漏
- 跟踪 Java™ 堆中可供服务器使用的可用内存的稳定下降趋势。当 Java 堆接近最大配置大小时,可以执行堆转储或重新启动服务器。
- 堵塞条件
- 跟踪具有显著降低的响应时间的请求。此策略依赖于对给定时间系列数据的更改点检测。
- 工作负载条件
- 指定在策略成员重新启动以清除内存和高速缓存数据前所维护的请求数。
- 垃圾回收百分比条件
- 监视一个 Java 虚拟机 (JVM) 或一组 JVM,以确定它们在指定的时间段内花费在垃圾回收的时 间是否超过所定义的百分比。
借助这些预定义的运行状况策略条件,已采取相应操作来优化所需数据的分发,最小化监视的影响及增强环境中的运行状况策略。
如果预定义的运行状况条件不满足您的需求,那么还可以为运行状况策略定义定制条件。可以将定制条件定义为根据环境中的度量值来测试的子表达式。定义定制条件时,要考虑收集数据,分析数据和实施运行状况策略(如果需要)的成本。此成本会因网络中的流量和服务器数而增加。在生产中使用定制运行状况条件之前要分析其性能。PMIMetric_FromServerStart$systemModule$cpuUtilization > 90L
运行状况操作
运行状况操作定义运行状况条件未得到满足时要使用的过程。根据所定义条件的不同,操作会有所不同。下表列示在各种服务器环境中受支持的运行状况操作:
运行状况操作 | 在相同 Intelligent Management 单元中运行的 WebSphere® 应用程序服务器 | 其他中间件服务器(包含外部 WebSphere 应用程序服务器) |
---|---|---|
重新启动服务器 | 受支持 | 受支持 |
执行线程转储 | 受支持 | 不受支持 |
执行 Java 虚拟机 (JVM) 堆转储 | 支持在 IBM® Software Development Kit 上运行的服务器 | 不受支持 |
将服务器置于维护方式 | 受支持 | 受支持 |
将服务器置于维护方式并中断 HTTP 和 SIP 请求与服务器的亲缘关系 | 受支持 | 受支持 |
使服务器脱离维护方式 | 受支持 | 受支持 |
生成简单网络管理协议 (SNMP) 陷阱 | 受支持 | 受支持 |
- 原地重新启动(停止服务器,然后启动服务器)。始终在动态集群处于手动方式时重新启动。
- 在另一个节点上启动服务器实例,然后停止失败的实例。
- 仅停止失败的服务器,此时假定余下的应用程序实例可以满足需求。
另外,还可以定义定制操作。借助定制操作,可定义违反运行状况条件时要运行的可执行文件。必须先定义定制操作,然后才能创建包含定制操作的运行状况策略。
运行状况策略目标
运行状况策略目标可以是单个服务器、集群或动态集群中的各个服务器、随需应变路由器 (ODR) 或者单元中的各个服务器。可以定义多个运行状况策略来监视同一组服务器。
如果您使用预定义的运行状况条件,该支持会因服务器类型的不同而有所不同。某些中间件服务器并不支持所有策略类型。下表按服务器类型总结了运行状况策略支持:预定义的运行状况策略 | 在相同 Intelligent Management 单元中运行的 WebSphere 应用程序服务器 | 其他中间件服务器(包含外部 WebSphere 应用程序服务器) |
---|---|---|
基于时效的策略 | 受支持 | 受支持 |
工作负载策略 | 受支持 | 受支持 |
内存泄漏检测 | 受支持 | 不受支持 |
超出内存使用率 | 受支持 | 受支持(对于 WebSphere Application Server Community Edition 服务器)。不支持其他中间件服务器类型。 |
超出请求超时 | 受支持 | 受支持(对于 ODR 将请求路由至的其他中间件服务器)。 |
超出响应时间 | 受支持 | 受支持 |
堵塞检测 | 受支持 | 受支持 |
垃圾回收百分比 | 受支持 | 不受支持 |
缺省运行状况策略
可以使用随该产品安装的预定义运行状况条件创建缺省运行状况策略。
要创建缺省运行状况策略,请单击
,并选择其中的一个预定义的运行状况条件。- 缺省内存泄漏:缺省的标准检测级别。缺省内存泄漏运行状况策略使用性能顾问程序功能。启用此策略时启用性能顾问程序。要禁用性能顾问程序,请移除此运行状况策略或缩小运行状况策略的成员资格的范围。要保留该运行状况策略以供将来使用,请保留缺省内存泄漏策略,但要移除所有成员。要更改成员,请单击 。通过从策略添加和移除成员可编辑运行状况策略成员资格。
- 缺省超出内存使用率:设置为 JVM 堆大小的 95%,达 15 分钟
- 缺省超出请求超时:设置为请求超时的 5%
- 缺省超出响应时间:设置为 120 秒
- 缺省堵塞:缺省的标准检测级别
- 垃圾回收百分比:设置成 10%。缺省抽样时间是 2 分钟。
要查看缺省运行状况策略所作的建议,并且要根据这些建议执行操作,请单击
。