Documentation
(C) IBM Corp. 1996, 2000

DB2 Text Extender


名詞解釋

此名詞解釋定義了本手冊的許多術語及縮寫。 如果您找不到您要找的術語,請參照索引或 Dictionary of Computing, New York: McGraw-Hill, 1994。

三劃

已起始設定的 handle (initialized handle)
預先準備的 handle,只包含文字格式, 或只包含文字語言,或是二者皆有。

四劃

分割的資料庫 (partitioned database)
由數個部份所組成的資料庫, 而每個部份是由各自的資料庫分割區伺服器所維護。

文件 (document)
請參閱文字文件

文件 handle (document handle)
請參閱 handle

文件模型
依區段內容而定義的各種文件結構。 可幫助 DB2 Text Extender 在編製索引時判別文件內有哪些區段。 文件模型會列出識別區段的標記標籤。 您可以針對每一個標籤,指定用於查詢該區段的敘述性區段名稱。 您可在一個文件模型檔中指定一或多個文件模型。

文字文件 (text document)
儲存在 DB2 表格的文字類型 CHAR、GRAPHIC、VARGRAPHIC、LONG VARGRAPHIC、DBCLOB、VARCHAR、 LONG VARCHAR 或 CLOB。

文字直欄 (text column)
含有文字文件的直欄。

文字表格 (text table)
一種 DB2 表格,它含有文字直欄

文字架構 (text configuration)
索引、文字及處理值的預設設定。

文字索引 (text index)
從文字文件擷取的重要詞彙集。 每一個詞彙與擷取它的文件相關。 透過搜尋索引而非搜尋文件,大幅縮短搜尋時間。 亦請參閱 精確索引語言索引

文字資訊 (text information)
文字文件內容說明︰

CCSID

格式

語言

日誌表格 (log table)
DB2 Text Extender 所建立的表格,包含要編製索引之文字文件的相關資訊。 每當已啟用之文字直欄中的文件有新增、變更或刪除的動作發生時, 就會用起始動作定義 來將此資訊儲存在日誌表格中。

五劃

出現 (occurrence)
相符者 同義。

外部檔 (external file)
檔案形式的文字文件,儲存在作業系統的檔案系統中, 而不是在 DB2 控制下之表格中的資料格形式。

布林搜尋 (Boolean search)
用布林運算子來合併一或多個搜尋術語的搜尋作業。

目錄概略表 (catalog view)
由 DB2 Text Extender 所建立的系統表格概略表,用於管理目的。 目錄概略表包含已啟用來供 DB2 Text Extender 使用之表格及直欄的相關資訊。

六劃

共用索引表格 (common-index table)
一種 DB2 表格,其文字直欄會共享共用的文字索引。 亦請參閱多重索引表

多種索引表格 (multi-index table)
一種 DB2 表格,其文字直欄有個別的文字索引。 亦請參閱一般索引表

字典 (dictionary)
與語言相關的語言資訊集成;在特定語言文件的文字分析、編製索引、 修復及強調顯示作業的期間,DB2 Text Extender 會使用此集成。

字碼頁 (code page)
針對所有字碼點而指定的圖形字元及控制功能意義。 例如,指定為 256 字碼點的字元及意義,可使用 8 位元字碼。

存取函數 (access function)
使用者提供的函數,可將儲存在直欄中的資料類型,轉換為 DB2 Text Extender 可處理的類型。

七劃

更新頻率 (update frequency)
更新文字索引的頻率,以日期、小時、分鐘以及最小文件名稱數目表示, 日誌表必須先列示它們,然後才能編製索引。

八劃

使用者定義的函數 (user-defined function -- UDF)
DB2 使用者建立的一種 SQL 函數,它與 DB2 提供的 SQL 函數相對照。 DB2 Text Extender 提供 UDF 格式的管理和搜尋函數,例如 CONTAINS。

使用者定義的特殊類型 (user-defined distinct type -- UDT)
DB2 使用者建立的一種資料類型,它與 DB2 提供的資料類型,如 LONG VARCHAR,相對照。

函數 (function)
請參閱存取函數

定期編製索引 (periodic indexing)
依據預先決定的時間間隔(以日、小時及分鐘來表示)以及在進行編製索引之前, 必須列在日誌表格 中之文件名稱的最小數,來進行編製索引。

九劃

指令行處理器 (command line processor)
一種叫做 DB2TX 的程式:

可讓您輸入 DB2 Text Extender 指令

處理指令

顯示結果。

界限搜尋 (bound search)
依據字詞界限的韓語文件搜尋。

相符者 (match)
在文字文件中,所搜尋之術語的出現。

計數 (count)
一個關鍵字,它用來指定詞庫中術語的層次數目 (深度), 這些層次在給定的關係中是用來擴展搜尋術語。

十劃

修正 (refine)
將前一個搜尋的搜尋準則新增至其它搜尋準則減少符合數目。

案例 (instance)
具邏輯性的 DB2 Text Extender 環境。 同一個工作站上可以有數個 DB2 Text Extender 的案例,但是每一個 DB2 案例都只能有一個案例。 您可用這些案例來:

分隔研發環境及生產環境

限制只有特定群組的人士才能存取敏感資訊。

案例變數 (instance variable)
一種變數,可用來提供預設值給案例擁有者的名稱, 或是給案例擁有者的起始目錄的名稱。

格式 (format)
文件的類型,例如 ASCII 或 WordPerfect。

特性搜尋 (feature search)
一種搜尋術語 (如:人名、地點或組織) 的作業, 可在用 FEATURE_EXTRACTION 索引選項建立的語言索引中執行。

特殊類型 (distinct type)
請參閱使用者定義的特殊類型

索引性質 (index characteristics)
文字索引內容決定︰

儲存索引的目錄

索引類型

更新索引的頻率

第一次進行編製索引的時間。

索引類型 (index type)
文字索引的一個特性,可決定含有文件術語的精確或語言形式。 請參閱精確索引、 語言索引、Ngram 索引

純文字搜尋 (free-text search)
一種搜尋方式,其搜尋術語是以自由形式的文字來表達; 自由形式文字是一種以自然語言來說明所要搜尋之主旨的詞組或句子。

起始動作定義 (trigger)
每次在文字直欄新增、變更或刪除文件時, 將有關必須編製索引的文件資訊自動新增至日誌表的一種機制。

追蹤 (tracing)
在檔案中儲存資訊的動作,以後您可使用該檔案找出錯誤原因。

十一劃

停止字詞 (stop word)
一個常見的字,如在文字文件中的 "before" 這個字,會從文字索引排除, 若它內含於搜尋引數中,則會被忽略。

停用 (disable)
把在啟用處理期間所建立的項目除去, 以將資料庫 、文字表格或文字直欄回復成它在啟用給 DB2 Text Extender 使用之前的狀況。

強調顯示資訊 (highlighting information)
請參閱資料串流

啟用 (enable)
準備資料庫 、文字表格或表格直欄,供 DB2 Text Extender 使用。

混合搜尋 (hybrid search)
布林搜尋純文字搜尋 的合併。

脫離字元 (escape character)
一種字元,可用來表示不要將後續字元解譯為遮罩字元

設定檔 (profile)
請參閱環境設定檔

十二劃

智慧型搜尋 (fuzzy search)
一種搜尋作業,可尋找拼字與搜尋術語相似的字詞。

等級 (rank)
在 0 與 1 之間的 DOUBLE 類型的絕對值, 表示與其它所找到的文件相比,此文件符合搜尋準則的程度為何。 此值會依據文件的大小,指出在此文件中找到的相符者個數。

十三劃

搜尋引數 (search argument)
搜尋時指定的一些條件,它含有一個或多個搜尋詞彙及搜尋參數。

萬用字元 (wildcard character)
請參閱遮罩字元

節點 (node)
分割的資料庫 環境中的伺服器。 另請參閱邏輯節點實體節點節點群組

節點群組 (nodegroup)
一或多個資料庫分割區伺服器的已命名的子集。 指定給實體上已分隔之機器的節點。 另請參閱邏輯節點

資料串流 (data stream)
API 函數所傳回的資訊、包含所搜尋之術語的組合文字 (至少有一個段落), 以及強調顯示在該文字中找到之術語的資訊。

十四劃

實體節點 (physical node)
指定給實體上已分隔之機器的節點。 另請參閱邏輯節點

精確索引 (precise index)
一種文字索引, 所包含的術語與其擷取之來源文字文件上的術語完全一樣。 亦請參閱語言索引Ngram 索引

語言 (language)
編製索引、搜尋及瀏覽 時, 所要使用的字典 名稱。

語言索引 (linguistic index)
一種文字索引, 包含經由語言處理程序而變成基本形式的術語。 例如,"Mice" 可當作 "mouse" 來編製索引。 亦請參閱精確索引Ngram 索引

十五劃

編製索引 (index)
從文字中取出有意義的術語,並將其儲存在文字索引 中。

遮罩字元 (masking character)
用來代表放在搜尋術語前面、中間及結尾的選用性字元。 一般而言,遮罩字元會用來在精確索引中尋找術語的變量。

十七劃

應用程式設計介面 (application programming interface -- API)
應用程式及 DB2 Text Extender 資訊修復服務程式之間的一般目的介面。

檔案 handle (file handle)
請參閱 handle

環境設定檔 (environment profile)
隨著 DB2 Text Extender 提供的 Script,包含環境變數 的設定值。

環境變數 (environment variable)
用來提供預設值給 DB2 Text Extender 環境的值的變數。

十八劃

擴充 (expand)
將從詞典衍生的額外術語新增至搜尋術語。

擴充配對 (extended matching)
一種與字典 的使用有關的處理程序, 可強調顯示搜尋術語的不明顯相符者。

擷取 (retrieve)
用其中一種 DB2 Text Extender 搜尋函數中的搜尋引數來尋找文字文件。

瀏覽 (browse)
檢視電腦監視器上所顯示的文字。

瀏覽器 (browser)
一種 DB2 Text Extender 功能,可讓您顯示電腦監視器上的文字。

二十三劃

邏輯節點 (logical node)
與其它節點一起分派給同一實體機器的節點。 另請參閱實體節點

A

API
應用程式設計介面。

C

CCSID
編碼字集識別字。

D

DB2 Extender
程式群組中的程式之一,除了傳統的數字及字元資料外, 還可讓您儲存及擷取資料類型,例如:壓縮檔、音效及影像資料,以及複雜文件。

DBCS
雙位元組字元支援。

E

extender
請參閱 DB2 Extender

H

handle
用來定義文字文件的二進位值。 其中包括:

文件 ID

相關索引的名稱及位置

文件的文字資訊

如果該文件的位置是在非 DB2 控制之下的外部檔中,則包含檔案的路徑及名稱。

當文字直欄已啟用 來供 DB2 Text Extender 使用時, 就會針對該直欄中的每一個文字文件來建立 handle。

N

Ngram 索引 (Ngram index)
一種文字索引, 可支援 DBCS 文件以及 SBCS 文件的智慧型搜尋。 亦請參閱語言索引精確索引

S

SBCS
單一位元組字元支援。

Shell 設定檔 (shell profile)
請參閱環境設定檔

U

UDF
使用者定義的函數。

UDT
使用者定義的特殊類型。


[ 頁面頂端 | 前一頁 | 下一頁 | 目錄 | 索引 ]