Windows NT 和 Windows 2000︰%DMBMMPATH%\instance\%DB2INSTANCE%\db2tx\txinsnnn 對於每一個伺服器案例,此檔案只出現一次。
文字分析架構檔中,除了 ngram 索引以外,含有每一種索引類型的更新和查詢處理區段。 您應該只變更在此說明的選項。 如果變更其它登錄,則在更新或查詢處理期間可能會導致錯誤。
下列選項適用於:
選項 | 預設值 | 說明 |
---|---|---|
FilterSet | 無,必要的 | 架構檔中的區段名稱,含有停止字詞過濾規則, 例如 StwUseAllUpCs、StwIgnAllUpCs。 |
Normalize | 否 | 指定索引是否正常化。
如果設定為 yes, 正常化將全部字元轉換成小寫,將區別字元取代成基本字元。
如果設定為 No,NormalizeUmlauts 和 ConvertAllUpperToLower 登錄會被忽略。 |
NormalizeUmlauts | 是 | 指定是否要取代母音變化,例如 ä 取代成為 ae。這僅適用於德語、丹麥語、瑞典語或挪威語文件。 |
ConvertAllUpperToLower | 否 | 指定全大寫的字詞是否要轉換成小寫。 |
[TAF_Filter:STWUSEALLUPCS] [TAF_Filter:STWIGNALLUPCS]
這些區段中的選項說明停止字詞過濾設定。區段 [TAF_Filter:STWUSEALLUPCS]
將全大寫的字詞視為大小寫混合的字詞,區段 [TAF_Filter:STWIGNALLUPCS]
定義全大寫字詞的特殊處理方式。
選項 | 預設值 | 說明 |
---|---|---|
FilterType | TAF_FILTER_STW | 架構檔中含有停止字詞過濾規則的區段。 |
MinTokenLength | 3 | 一個符記必要的最小字元數。如果符記的長度小於此值,則不會編製索引。 此為 >= 1 的整數值。 |
MinUpperCaseTokenLength | 2 | 一個全大寫符記必要的最小字元數。 如果符記的長度小於此值,則不會編製索引。此為 >= 1 的整數值。 |
UseAlternateTerritories | 否 | 指定如果找不到語言專用的字典時,是否使用替代字典來處理停止字詞。
如果設定為 yes,則使用符合語言的第一個停止字詞字典。 例如,如果現行語言是 en-gb,但找不到 en-gb.tsw 停止字詞檔案,則使用 en-us.tsw 停止字詞檔案。
如果設定為 no,則不執行停止字詞過濾。 |
[TAF_AnnotationType:TAF_ThesaurusEntry ]
本區段設定需要詞典擴充的查詢預設值。
關鍵字 | 預設值 | 說明 |
---|---|---|
ThesBaseName | desthes | 設定詞典的預設名稱,使用於需要查詢擴充的查詢。 名稱是一個字串。 |
Depth | 1 | 對於需要詞典擴充的查詢所用的詞典,設定遍訪的預設路徑。 此為 >= 1 的整數值。 |
[TAF_PlugIn:TAF_POE ]
若要變更啟動文字搜尋處理程式時所預載的預設語言環境,您可在 PreloadLanguages 選項中定義一個語言。
選項 | 預設值 | 說明 |
---|---|---|
PreloadLanguages | EN-US | 指定啟動時預載的一組語言專用資源。 例如,如果應用程式處理義大利語文件, 則載入義大利語的資源。欄位的值採用 XX-YY 格式, 其中 XX 是語言,YY 是領域。 |