Documentation
(C) IBM Corp. 1996, 2000

DB2 Text Extender


擷取的語言處理程序

查詢處理的目的是要減少搜尋術語的作用, 這樣才能增加搜尋的取回率,亦即,會找到更多相關的文件。 在查詢術語上有二種基本作業可達到這個目標;即為展開與還原。此外, 有些搜尋術語同時包含了展開與還原。

同義字

同義字是一些語意上相關的字詞。通常,這些字詞的字詞類別(如名詞、動詞等)與來源術語相同。 同義字是從每種語言的個別檔案中取得。它們一般是以基本形式傳回, 且在極少的例外狀況中,並不是多個字詞組成的術語。 查閱同義字時,一定會將搜尋術語字詞還原成基本形式。 此處是三種語言的 word 同義字範例:

詞典展開

透過特定的關係,可使用詞典術語來展開搜尋術語。這些關係可能是階層式 (如「狹義術語」關係)、關聯式(如「相關術語」關係), 或者可能是同義字關係。詞典術語可能是(且經常是)多個字詞組成的術語。

詞典概念對詞典展開做更詳細的說明。

完成詞典查閱時,搜尋術語 (起始術語) 未正常化。 詞典查閱所得的字詞會根據索引類型還原成基本形式。

聲音展開

聲音展開會利用一組發音類似的字詞來展開單一字詞。在不清楚要搜尋之術語的正確拼法時, 這個方式十分有用。

字元及字詞遮罩

遮罩是非語言展開技術,是用滿足它的所有索引 wordsit 的反意連接詞來取代。遮罩表示式或它的任一種表示式都不是取決於標題化、 停止字詞取出,或其它任何一種展開技術。結果可能是當搜尋遮罩術語 swu* 時, 在精確索引(而非語言索引)中可能會找到非正規動詞形式 swum, 因為此形式已變更為 swim

若您使用文字遮罩,那麼效能可能會減慢,尤其是在搜尋大量索引時。


[ 頁面頂端 | 前一頁 | 下一頁 | 目錄 | 索引 ]