Documentation
(C) IBM Corp. 1996, 2000

DB2 Text Extender


瀏覽的語言處理程序

在瀏覽搜尋後所找到的文件時,也可使用語言處理。處理的階段有二:

  1. 基本文字分析:正常化及術語展開
  2. 擴充比對。

階段 1:正常化及術語展開

第一階段並不需要使用電子字典。

正常化

正常化會在基本文字分析中予以說明。

術語展開

術語展開與將術語還原成基本形式相反。如果是語言索引, 則在開始搜尋之前,搜尋術語會還原成基本形式。

同樣地,如果使用語言索引,文件的術語在新增到索引之前, 將先還原成基本形式。 因此,可依據術語的基本形式來找到文件。

但在瀏覽找到的文件時,您可能會想要查看已標出之基本形式的所有變體。若要以高亮度標示這些變體, 則會展開找到的基本術語。

每個在字典中找到之術語的所有變體(詞形變化)都是可產生的。下面是為德語字詞 gehen(到)產生的詞形變化:

gegangen  geh    gehe    gehen    gehend  gehest  gehet  gehst
ging      ginge  gingen  gingest  ginget  gingst  gingt  geht

階段 2:擴充相符

第二階段是擴充比對,可用在基本文字分析及正常化無法用高亮度標示找到的術語時, 這種狀況十分罕見。 擴充比對會尋找較含糊的相符項目。

在 DesOpenDocument API 函數中,將 DES_EXTENDED 指定成參數, 就可選擇擴充比對。

擴充比對使用的語言處理與語言索引相同。

下列是擴充比對可找到其它相符項目的情況:


[ 頁面頂端 | 前一頁 | 下一頁 | 目錄 | 索引 ]