![[z/OS]](../images/ngzos.gif)
对等重新启动和恢复
每个系统的目标是尽可能减少停机时间。但是,有时系统故障是不可避免的。例如,可能会因为主系统中的电源突然断掉而导致系统故障。当发生系统故障时,您可以采取的重新启动操作是在综合系统中的对等系统上重新启动。此类型的重新启动使用对等重新启动和恢复功能。启动系统上的服务器(而该服务器未配置到该系统)将隐式地将它置于对等重新启动和恢复方式。

当您遇到主系统故障导致不确定事务具有未知输出时,在可以再次使用数据之前,您需要获取那些预期的事务输出(理论上是正确的)。对等重新启动和恢复提供完成此操作的以下自动方法:通过在对等系统上重新启动控制器以使阻塞数据的“锁定”可以被删除并确定输出。这与系统通常通过自动回滚来处理故障的方式形成对比。
如果发生故障,那么自动重新启动管理:
- 可以在同一系统上重新启动产品和相关服务器,或
- 可以使用对等重新启动和恢复功能来在单元中的另一个系统上重新启动相关的服务器
服务器不是可恢复的资源管理器。它是可恢复的通信管理器。它本身没有可恢复的锁定,并且它不需要管理锁定,也不需要管理日志中的锁定状态。它只需要确保在分布式事务的每个通信会话中连接调用者和被调用者。)
对等重新启动和恢复在另一个系统上重新启动控制器并完成事务重新启动和恢复过程,这样我们就可以将输出指定给发生故障时正在进行的事务。此事务重新启动和恢复过程期间,可能暂时无法访问数据,直到恢复过程完成为止。重新启动和恢复过程不会导致数据丢失。
发生故障时正在访问的资源管理器(如 DB2®)可能保持锁定,其锁定范围为事务 UR(恢复单元)。一旦已将输出指定给 UR,通常资源管理器将删除那些锁定。