Documentation
(C) IBM Corp. 1996, 2000

DB2 Text Extender


文字分析架構檔

檔名
DESTAF.TCF

位置
UNIX︰DB2TX_INSTOWNERHOMEDIR/db2tx/TXINSnnn

Windows NT 和 Windows 2000︰%DMBMMPATH%\instance\%DB2INSTANCE%\db2tx\txinsnnn 對於每一個伺服器案例,此檔案只出現一次。

文字分析架構檔中,除了 ngram 索引以外,含有每一種索引類型的更新和查詢處理區段。 您應該只變更在此說明的選項。 如果變更其它登錄,則在更新或查詢處理期間可能會導致錯誤。

一般選項

下列選項適用於:


選項 預設值 說明
FilterSet 無,必要的 架構檔中的區段名稱,含有停止字詞過濾規則, 例如 StwUseAllUpCs、StwIgnAllUpCs。
Normalize 指定索引是否正常化。

如果設定為 yes, 正常化將全部字元轉換成小寫,將區別字元取代成基本字元。

如果設定為 No,NormalizeUmlauts 和 ConvertAllUpperToLower 登錄會被忽略。

NormalizeUmlauts 指定是否要取代母音變化,例如 ä 取代成為 ae。這僅適用於德語、丹麥語、瑞典語或挪威語文件。
ConvertAllUpperToLower 指定全大寫的字詞是否要轉換成小寫。

[TAF_Filter:STWUSEALLUPCS] [TAF_Filter:STWIGNALLUPCS]

這些區段中的選項說明停止字詞過濾設定。區段 [TAF_Filter:STWUSEALLUPCS] 將全大寫的字詞視為大小寫混合的字詞,區段 [TAF_Filter:STWIGNALLUPCS] 定義全大寫字詞的特殊處理方式。
選項 預設值 說明
FilterType TAF_FILTER_STW 架構檔中含有停止字詞過濾規則的區段。
MinTokenLength 3 一個符記必要的最小字元數。如果符記的長度小於此值,則不會編製索引。 此為 >= 1 的整數值。
MinUpperCaseTokenLength 2 一個全大寫符記必要的最小字元數。 如果符記的長度小於此值,則不會編製索引。此為 >= 1 的整數值。
UseAlternateTerritories 指定如果找不到語言專用的字典時,是否使用替代字典來處理停止字詞。

如果設定為 yes,則使用符合語言的第一個停止字詞字典。 例如,如果現行語言是 en-gb,但找不到 en-gb.tsw 停止字詞檔案,則使用 en-us.tsw 停止字詞檔案。

如果設定為 no,則不執行停止字詞過濾。

[TAF_AnnotationType:TAF_ThesaurusEntry ]

本區段設定需要詞典擴充的查詢預設值。
關鍵字 預設值 說明
ThesBaseName desthes 設定詞典的預設名稱,使用於需要查詢擴充的查詢。 名稱是一個字串。
Depth 1 對於需要詞典擴充的查詢所用的詞典,設定遍訪的預設路徑。 此為 >= 1 的整數值。

[TAF_PlugIn:TAF_POE ]

若要變更啟動文字搜尋處理程式時所預載的預設語言環境,您可在 PreloadLanguages 選項中定義一個語言。
選項 預設值 說明
PreloadLanguages EN-US 指定啟動時預載的一組語言專用資源。 例如,如果應用程式處理義大利語文件, 則載入義大利語的資源。欄位的值採用 XX-YY 格式, 其中 XX 是語言,YY 是領域。


[ 頁面頂端 | 前一頁 | 下一頁 | 目錄 | 索引 ]