在瀏覽搜尋後所找到的文件時,也可使用語言處理。處理的階段有二:
第一階段並不需要使用電子字典。
正常化會在基本文字分析中予以說明。
術語展開與將術語還原成基本形式相反。如果是語言索引, 則在開始搜尋之前,搜尋術語會還原成基本形式。
同樣地,如果使用語言索引,文件的術語在新增到索引之前, 將先還原成基本形式。 因此,可依據術語的基本形式來找到文件。
但在瀏覽找到的文件時,您可能會想要查看已標出之基本形式的所有變體。若要以高亮度標示這些變體, 則會展開找到的基本術語。
每個在字典中找到之術語的所有變體(詞形變化)都是可產生的。下面是為德語字詞 gehen(到)產生的詞形變化:
gegangen geh gehe gehen gehend gehest gehet gehst ging ginge gingen gingest ginget gingst gingt geht
第二階段是擴充比對,可用在基本文字分析及正常化無法用高亮度標示找到的術語時, 這種狀況十分罕見。 擴充比對會尋找較含糊的相符項目。
在 DesOpenDocument API 函數中,將 DES_EXTENDED 指定成參數, 就可選擇擴充比對。
擴充比對使用的語言處理與語言索引相同。
下列是擴充比對可找到其它相符項目的情況:
會處理遮罩字元、完成搜尋術語的主語還原,且找到對應的文件。不使用擴充比對, 就不會用高亮度標示與指定搜尋準則相符的文字。
範例:含有已變化詞形之術語 swam 的文件。
日耳曼語的文件中含有複合字詞,且是用語言索引來加以編製索引時, 文件索引會保留複合字詞的組件及複合字詞本身。搜尋複合字詞的組件時, 會找到含有此複合字詞的文件,但若未使用擴充比對, 則不會用高亮度標示此字詞。
範例:含有德語字詞 Apfelbaum(蘋果樹)的文件。
如果文書處理器自動插入連字號, 則會找到並用高亮度標出用連字號連接的字詞。 然而,如果連字號是由使用者鍵入,則會找到含有此字詞的文件, 但若未使用擴充比對,則不會用高亮度標出此字詞。
範例:文件含有用連字號連接的字詞 container,而在行尾是被斷成:
Another name for a folder is a con- tainer.