傳訊引擎異常狀況回復

在服務整合中,可能會有不需要重新啟動傳訊引擎的異常狀況、需要自動重新啟動傳訊引擎的異常狀況、明確的性能監視所偵測到且由 HAManager 來處理的異常狀況,以及需要使用者人為介入的異常狀況。

在傳訊引擎執行時進行回復

傳訊引擎可以處理某些異常狀況,且不需要重新啟動傳訊引擎或進行失效接手。 異常狀況會自動更正,在系統錯誤日誌中,會新增一個項目來說明異常狀況及建議任何使用者動作。 傳訊引擎會繼續執行,並遵循針對所處理訊息指定的服務品質。

自動重新啟動傳訊引擎來進行回復(區域異常狀況)

通過自動重新啟動傳訊引擎,可以在現行伺服器上,或在替代伺服器上,將傳訊引擎從區域異常狀況中回復。 比方說,如果傳訊引擎無法連接到它的資料儲存庫,有可能是執行傳訊引擎的伺服器無法建立通往資料儲存庫的連線,但相同叢集中的另一部伺服器可以。 在高可用性配置中,也就是說,已啟用失效接手,HAManager 會停止及停用現行伺服器中的傳訊引擎,然後用新的伺服器來進行傳訊引擎的失效接手。 30 秒之後,會自動啟用已停用的傳訊引擎。

從明確的性能監視所偵測到的異常狀況中回復

傳訊引擎無法偵測執行緒旋轉(執行緒陷入迴圈中,不再執行有用的工作)或死鎖(兩個執行緒彼此互相封鎖)之類的異常狀況,但明確的性能監視可以。 HAManager 提供了這類監視,且會定期測試傳訊引擎的性能。 如果 HAManager 偵測到使用資料儲存庫的傳訊引擎無法正常執行,HAManager 會停止及停用傳訊引擎。 如果傳訊引擎使用檔案儲存庫,HAManager 會關閉代管傳訊引擎的伺服器。 如果伺服器在叢集中,且傳訊引擎的原則容許進行失效接手,HAManager 會在替代伺服器上重新啟動傳訊引擎。 如果已停用的傳訊引擎使用資料儲存庫,30 秒之後,這個傳訊引擎會自動啟用。

需要使用者人為介入的回復(廣域異常狀況)

透過傳訊引擎的重新啟動或失效接手,無法將傳訊引擎從廣域異常狀況中回復。 比方說,如果傳訊引擎的資料儲存庫毀損,在另一部伺服器上執行傳訊引擎,並無法解決問題,因為仍會遇到相同的問題。 如果這個狀況的傳訊引擎進行失效接手,傳訊引擎會不停地進行失效接手,因為它無法在任何伺服器中執行。 叢集會發生不必要的中斷,因為伺服器會嘗試執行傳訊引擎,然後關機。 為了避免這類狀況,如果發生廣域異常狀況,傳訊引擎會記載一則錯誤、停止處理訊息,且不進行失效接手。 在更正廣域異常狀況及重新啟動伺服器之前,傳訊引擎無法重新啟動。


指出主題類型的圖示 概念主題



時間戳記圖示 前次更新: last_date
http://www14.software.ibm.com/webapp/wsbroker/redirect?version=cord&product=was-nd-mp&topic=cjt0004_
檔名:cjt0004_.html