版次注意事項


|22.14 篩選「資料倉儲中心」的名稱與位址

|22.14.1

| |

|使用「資料倉儲中心」和「Trillium 軟體系統」來篩選名稱與位址資料。 |「Trillium 軟體系統」是一個名稱與位址篩選產品, |可以重新格式化、標準化及驗證名稱和位址資料。藉由從使用者定義程式啟動「Trillium 批次系統」程式,您可以在「資料倉儲中心」中使用「Trillium 軟體系統」。 |當您從「Trillium 批次系統」Script 或 JCL 匯入描述資料時,會將使用者定義程式新增至「倉儲」樹狀結構中。

|「資料倉儲中心」已提供與 Vality and Evolutionary Technologies, Inc 的工具之整合。

|22.14.1.1 基本要求

|

|下表顯示軟體需求。


|
作業系統 必要的軟體
UNIX Trillium 軟體系統 版本 4.0

「資料倉儲管理程式」版本 7.2 倉儲代理程式

Windows NT 與 Windows 2000

Trillium 軟體系統 版本 4.0

「資料倉儲管理程式」版本 7.2 倉儲代理程式

以遠端存取而言,主電腦必須安裝 ftpd 和 rexecd 常駐程式。

OS/390 安裝在遠端 OS/390 主電腦的「Trillium 軟體系統」版本 4.0

安裝在 UNIX、Windows NT 上的「資料倉儲管理程式」版本 7.2 倉儲代理程式

必須安裝 TCP/IP 3.2 (或以上)

僅支援為遠端主電腦的 OS/390 作業系統

|22.14.1.2 Trillium 軟體系統元件

|「Trillium 軟體系統」由四個主要元件組作: |轉換器、剖析器、geocoder 及匹配器。使用這些元件為一組功能, |以執行名稱與位址篩選作業。您可以從「Trillium 批次系統」(一個使用者定義程式) 執行這些元件。 |

|轉換器
|使用轉換器來標準化及將來源資料轉換成指定的輸出格式。

|剖析器
|使用剖析器來解譯名稱和位址來源資料,以及建立來源資料相關的描述資料。

|地理編碼程式 (Geocoder)
|使用 geocoder 將來源資料與郵遞服務程式資料做比較, |以提供任何遺漏資訊,例如寄件者或 ZIP+4 字碼。geocoder 也可透過「美國統計調查」 |資料來執行比對作業。

|匹配器
|使用匹配器來比較類似名稱和位址以識別重複記錄。 |您可以使用匹配器執行參照比對,以比較一個記錄與一組記錄。 |

|22.14.1.3 將「Trillium 批次系統」與「資料倉儲中心」搭配使用

|在「資料倉儲中心」中,您可以匯入「Trillium 批次系統」描述資料及建立使用者定義程式步驟。此步驟會呼叫本端倉儲代理程式端或遠端倉儲代理程式端上的「Trillium 批次系統」Script。 |在「資料倉儲中心」中,「Trillium 批次系統」Script 是一個具有來源及目標檔的步驟。來源檔是用於第一個「Trillium 批次系統」命令的輸入資料檔。 |目標檔是 Script 中最後一個 Trillium 命令所建立的輸出資料檔。 |然後,可複製此步驟至另一個處理程序,搭配其它步驟使用。

|下圖顯示「Trillium 批次系統」輸入及輸出資料檔與「資料倉儲中心」中來源及目標檔之間的關係。

|圖 1. 範例 Trillium Script 檔

|REM Running the converter
|pfcondrv -parmfile c:\tril40\us_proj\parms\pfcondrv.par
|REM Running the parser
|pfprsdrv -parmfile c:\tril40\us_proj\parms\pfprsdrv.par
|REM Running the Matcher
|cfmatdrv -parmfile c:\tril40\us_proj\parms\pfmatdrv.par
| 

|圖 2. pfcondrv.par 檔的內容

|INP_FNAME01 c:\tril40\us_proj\data\convinp
|INP_DDL01   c:\tril40\us_proj\dict\input.ddl
| 

|圖 3. pfmatdrv.par 檔的內容

|OUT_DDNAME  c:\tril40\us_proj\data\maout
|DDL_OUT_FNAME  c:\tril40\us_proj\dict\parseout.ddl

|圖 4. 「Trillium 批次系統」步驟定義

|c:\Tril40\us_proj\data\convinp (source file) -> 
|Trillium Batch System Step -> c:\tril40\us_proj\data\maout (target file)

|22.14.1.4 匯入 Trillium 描述資料

|若要匯入 Trillium 描述資料到「資料倉儲中心」: |

  1. |建立「Trillium 批次系統 Script」或 JCL。您可以使用任何 Script |或 JCL 撰寫工具來建立 Script 或 JCL 檔。
  2. |以滑鼠右鍵按一下倉儲,然後按一下匯入描述資料 -> Trillium,開啟「Trillium 批次系統」視窗。
  3. |Script 或 JCL 欄位中,鍵入您要執行的「Trillium 批次系統」Script 或 JCL 檔之名稱。
  4. |輸入檔欄位中,鍵入第一次在指定的 Script 或 JCL 檔中執行之「Trillium 批次系統」程式的輸入資料檔名稱。
  5. |輸入 DDL 欄位中,鍵入說明輸入資料檔的輸入 DDL 檔之名稱。此檔案必須可在倉儲代理程式端使用。
  6. |輸出檔欄位中,鍵入 Script 或 JCL 檔中最後一個「Trillium 批次系統」程式的輸出資料檔名稱。
  7. |輸出 DDL 欄位中,鍵入說明輸出資料檔的輸出 DDL 檔之名稱。此檔案必須可在倉儲代理程式端使用。
  8. |選用的:在輸出錯誤檔欄位中, |鍵入您要使用的輸出錯誤檔名稱。此錯誤檔會從「Trillium 批次系統」程式擷取執行期錯誤。這些錯誤記錄於 stderr 日誌中。以本端主電腦而言,若您未在此指定名稱, |則會建立預設輸出錯誤檔。有關輸出錯誤檔的詳細資訊,請參閱主題「錯誤處理常式」。
  9. |按一下連線標籤。
  10. |若您匯入的 Trillium 描述資料位於倉儲代理程式端上, |請按一下本端主電腦

    |若您匯入的 Trillium 描述資料不是位於倉儲代理程式端上, |請按一下遠端主電腦,然後指定遠端主電腦。 |請參閱本節稍後提到的主題「指定遠端主電腦」。

  11. |按一下確定,以匯入 Trillium 描述資料並關閉該筆記本。
  12. |若 Script 或 JCL 不是從預設代理程式端執行,請在「內容」筆記本中指定用於「Trillium 批次系統」步驟的倉儲代理程式端。 |

|匯入作業完成後,下列倉儲物件會新增至「倉儲」樹狀結構中。 |

|指定遠端主電腦

|若要指定遠端主電腦,請: |

  1. |按一下遠端主電腦,然後鍵入含有您匯入的描述資料之遠端系統的 TCP/IP 主電腦名稱。若選取「遠端主電腦」,則目標檔被建立為本端檔案, |因為遠端目標檔不受支援。您可以新增 FTP 步驟來使遠端檔案成為指定的本端目標檔。
  2. |遠端作業系統清單中,按一下您存取的遠端主電腦之作業系統。
  3. |遠端使用者 ID 欄位中,鍵入您存取的遠端主電腦之使用者 ID。
  4. |通行碼選項清單中,選取用於所要存取的遠端主電腦之通行碼選項:

    |

    |不需要通行碼
    |指定存取遠端主電腦的描述資料不需要通行碼。

    |擷取通行碼
    |指定從使用者定義程式擷取通行碼。

    |通行碼程式欄位中,鍵入將擷取通行碼的通行碼程式名稱。 |此程式必須位於倉儲代理程式端,並且將通行碼寫入輸出檔的第一行中。

    |程式參數欄位中,鍵入通行碼程式的參數。 |第一個參數必須是寫入通行碼的輸出檔。

    |稍後輸入通行碼
    |指定稍後再輸入通行碼。

    |在執行「Trillium 批次系統」程式的步驟之「內容」筆記本中,輸入通行碼。 |

    |

|22.14.1.5 對映描述資料

|為了建立來源和目標檔的描述資料,Trillium 會讀取 Trillium DDL 檔。 |此 DDL 檔會轉換成下列「資料倉儲中心」資料類型:


|
UNIX、Windows NT 及作業系統的 DDL 資料類型 倉儲資料類型
ASCII CHARACTER

ASCII NUMERIC

EBCDIC CHARACTER

EBCIDIC NUMERIC

CHARACTER(n)
其它類型 NUMERIC
註:
唯有「Trillium 軟體系統」在 OS/390 作業系統上執行,EBCDIC CHARACTER 和 EBCIDIC NUMERIC 資料類型才受到支援。

|變數 n 代表字串中的字元數。

|22.14.1.6 限制

|您可以透過「資料倉儲中心」中的匯入描述資料作業及 Trillium DDL, |在輸入及輸出 DDL 檔中指定一些重疊欄位。 |不過,相對應的倉儲來源及倉儲目標檔案不能在「資料倉儲中心」中搭配 SQL 步驟或範例內容使用。 |因為匯入描述資料作業會忽略越過整個記錄的重疊欄位,所以您仍可指定這些欄位, |但它們在結果來源及目標檔中不能當作直欄使用。

|若指定了錯誤檔,則 Script 的名稱不能包含任何空格。

|22.14.2 撰寫 Trillium 批次系統 JCL 檔

|若要撰寫 Trillium 批次系統 JCL 檔,下列需求必須符合。

|

|當 Script 或 JCL 在遠端主電腦上執行時,必須指定輸出錯誤檔; |否則,錯誤訊息不會被記錄及傳送至「資料倉儲中心」。 |在 UNIX 或 Windows 上,擷取錯誤訊息最簡單的方法是撰寫另一個呼叫「Trillium 批次系統」Script 的 Script,並將標準錯誤傳送至輸出檔。

|圖 5. 併入 SYSTERM DD 陳述式的工作步驟範例

|//SYSTERM  DD UNIT=&UNIT,
|//            DISP=(MOD,CATLG,KEEP),
|//            SPACE=(400,(20,20),,,ROUND),
|//            DSN=&PROJPREF.&TRILVER.&PROJECT.STDERR;

|22.14.3 在 UNIX 和 Windows 上撰寫 Trillium 批次系統 Script 檔

|若「Trillium 批次系統」Script 或參數檔包含輸入檔的相對路徑, |使用者必須將 Script 檔開頭的 cd 陳述式放置到 Script 檔的目錄中。

|22.14.4 定義 Trillium 批次系統步驟

|在定義「Trillium 批次系統」步驟之前,您必須將所要使用的 Trillium 描述資料匯入處理程序中。新增「Trillium 批次系統」步驟至處理程序中: |

  1. |開啟處理程序模型產生器中的處理程序。
  2. |按一下選用區上的 Trillium 批次系統圖示。
  3. |按一下 Trillium 批次系統程式 -> |programName,其中 programName 是您要使用的「Trillium 批次系統」程式名稱。
  4. |按一下畫布上您要顯示步驟所在的位置。
  5. |完成 DB2 Universal Database |說明中主題「定義一個執行使用者定義程式的步驟」內的步驟。 |

|22.14.5 使用「Trillium 批次系統」使用者定義程式

|「Trillium 批次系統」使用者定義程式隨附於 Windows NT 和 UNIX 的「DB2 資料倉儲中心」版本 7.2 中。您匯入 Trillium 描述資料時所建立的「Trillium 批次系統」步驟,將執行「Trillium 批次系統」使用者定義程式。 |使用者定義程式會呼叫「Trillium 批次系統」Script 或 JCL。下表包含用於「Trillium 批次系統」Script 或 JCL 的參數:


|
參數
遠端主電腦
  • localhost 為預設值。若「Trillium 批次系統」安裝在倉儲代理程式端, 則使用此值。
  • 若「Trillium 批次系統」安裝在遠端作業系統上,則使遠端主電腦名稱。

Script 或 JCL Script 或 JCL 的名稱
遠端作業系統 遠端主電腦上作業系統的名稱。 若遠端主電腦參數為 localhost,則系統不處理此參數。 有效值為:
  • MVS for OS/390 作業系統
  • UNIX for AIX、SUN Solaris、HP-UX 及 NUMA/Q 作業系統
  • WIN for Windows NT 或 2000 作業系統
遠端使用者 ID 擁有執行遠端命令的權限之使用者 ID。若 RemotehostName 的值為 localhost,則系統不處理此參數。
通行碼選項 取得通行碼的方法。有效值為:

ENTERPASSWORD
若通行碼在下一個參數傳遞,則使用此值。

PASSWORDNOTREQUIRED
若不需要通行碼,則使用此值。

GETPASSWORD
若程式名稱在下一個參數傳遞,則使用此值。

限制:

  • 此程式必須位於代理程式端、將通行碼寫入輸出檔的第一行中, 以及在順利執行後傳回 0。
  • 通行碼參數值必須是通行碼程式的名稱。
  • 程式參數值必須是以雙引號括住的字串。
  • 字串中第一個參數必須是寫入通行碼所在的輸出檔名稱。
通行碼 有效值為通行碼或通行碼程式名稱。通行碼程式必須位於倉儲代理程式端。
程式參數 通行碼程式的參數。
輸出錯誤檔 輸出錯誤檔的名稱。
註:
此表格中所有參數的資料類型為 CHARACTER。

|22.14.6 錯誤處理常式

|在 Windows NT 及 UNIX 作業系統上,「Trillium 批次系統」程式將錯誤訊息寫入標準錯誤 (stderr) 檔中,而在 OS/390 作業系統上,是寫入 SYSTERM 資料集中。

|若要擷取 Windows NT 或 UNIX 作業系統的「Trillium 批次系統」程式錯誤, |必須將標準錯誤重新導向至輸出錯誤檔。

|若要擷取 OS/390 作業系統的「Trillium 批次系統」程式錯誤, |JCL 必須併入 SYSTERM DD 陳述式。

|若在「匯入描述資料」視窗中指定輸出錯誤檔名,您必須重新導向或將標準錯輸出儲存至錯誤檔中。 |「資料倉儲中心」會讀取此檔案並傳回內含 ERROR 字串的所有行為錯誤訊息。 |所有「Trillium 批次系統」程式錯誤訊息都包含 ERROR 字串。

|若倉儲代理程式端上執行的 Script 或 JCL 中未指定輸出錯誤檔, |則「資料倉儲中心」會自動建立一個檔名並將標準錯誤輸出重新導向至該檔案。 |若發現任何錯誤,則不會刪除錯誤檔。錯誤檔儲存於環境變數 VWS_LOGGING 所指定的目錄中。 |該檔名為 tbsudp-date- |time.err,其中 date 是建立檔案的系統日期,而 time 是建立檔案的系統時間。 |下列檔名顯示輸出錯誤檔名的格式:

| tbsudp-021501-155606.err

|22.14.6.1 錯誤回覆碼


|
錯誤碼 說明
0 成功時
4 警告:通行碼檔案可能無法消除,或「Trillium 批次系統」使用者定義程式存取暫存檔時發生內部錯誤。

請檢查通行碼檔案狀態,或環境變數 VWS_LOGGING 所指定目錄下建立的所有暫存檔狀態。

8 參數值或數目不正確。 請參考日誌檔或文件來取得正確語法。
12 「Trillium 批次系統」使用者定義程式透過 FTP 連接遠端主電腦時發生問題。 檢查 FTP 連線或主電腦名稱、使用者 ID 及通行碼。
16 「Trillium 批次系統」使用者定義程式無法建立日誌或內部檔案。

檢查使用者有無正確授權及磁碟空間是否已滿。

20 無法執行 OS/390 JCL,或「Trillium 批次系統」使用者定義程式透過 FTP 從 OS/390 刪除或取得檔案時發生錯誤。

檢查 JESLogFile 來找出錯誤原因。

48 找不到環境變數 VWS_LOGGING 或無法建立日誌檔。 請參考日誌檔以取得詳細資訊。
56 無法執行 Windows NT 或 UNIX Script,或「Trillium 批次系統」使用者定義程式連接遠端主電腦時發生錯誤。檢查連線或主電腦名稱、使用者 ID 及通行碼。
500 Script 或 JCL 檔傳回錯誤,或未傳回錯誤,但錯誤檔包含資料。 請參考日誌檔以取得詳細資訊。在 OS/390 上,亦請參閱 JESLogFile。

|22.14.6.2 日誌檔

|當「Trillium 批次系統」使用者定義程式執行時,「資料倉儲中心」將所有診斷資訊儲存在日誌檔中。該日誌檔名稱為 tbsudp-date-time.log, |其中 date 是建立檔案的系統日期,而 time 是建立檔案的系統時間。 |該日誌檔建立於代理程式端上由環境變數 VWS_LOGGING 所指定的目錄中。 |若「Trillium 批次系統」使用者定義程式順利執行,則會刪除該日誌檔。


[ 頁面頂端 | 前一頁 | 下一頁 | 目錄 | 索引 ]