查詢處理的目的是要減少搜尋術語的作用, 這樣才能增加搜尋的取回率,亦即,會找到更多相關的文件。 在查詢術語上有二種基本作業可達到這個目標;即為展開與還原。此外, 有些搜尋術語同時包含了展開與還原。
同義字展開
詞典展開
標題化 (請參閱將術語還原成基本形式 (lemmatization))。
正常化 (請參閱將術語變成標準形式)。
停止字詞 (請參閱停止字詞過濾)。
字元及字詞遮罩
聲音展開。
同義字是一些語意上相關的字詞。通常,這些字詞的字詞類別(如名詞、動詞等)與來源術語相同。 同義字是從每種語言的個別檔案中取得。它們一般是以基本形式傳回, 且在極少的例外狀況中,並不是多個字詞組成的術語。 查閱同義字時,一定會將搜尋術語字詞還原成基本形式。 此處是三種語言的 word 同義字範例:
word: comment remark statement utterance term expression communication message assurance guarantee warrant bidding command charge commandment dictate direction directive injunction instruction mandate order news advice intelligence tidings gossip buzz cry hearsay murmur report rumor scuttlebutt tattle tittle-tattle whispering
mot: expression parole terme vocable lettre billet missive epître plaisanterie
Wort: Vokabel Bezeichnung Benennung Ausdruck Begriff Terminus Ehrenwort Brocken Bekräftigung Versprechen Zusicherung Gelöbnis Beteuerung Manneswort Schwur Eid Ausspruch
透過特定的關係,可使用詞典術語來展開搜尋術語。這些關係可能是階層式 (如「狹義術語」關係)、關聯式(如「相關術語」關係), 或者可能是同義字關係。詞典術語可能是(且經常是)多個字詞組成的術語。
詞典概念對詞典展開做更詳細的說明。
完成詞典查閱時,搜尋術語 (起始術語) 未正常化。 詞典查閱所得的字詞會根據索引類型還原成基本形式。
聲音展開會利用一組發音類似的字詞來展開單一字詞。在不清楚要搜尋之術語的正確拼法時, 這個方式十分有用。
遮罩是非語言展開技術,是用滿足它的所有索引 wordsit 的反意連接詞來取代。遮罩表示式或它的任一種表示式都不是取決於標題化、 停止字詞取出,或其它任何一種展開技術。結果可能是當搜尋遮罩術語 swu* 時, 在精確索引(而非語言索引)中可能會找到非正規動詞形式 swum, 因為此形式已變更為 swim。
若您使用文字遮罩,那麼效能可能會減慢,尤其是在搜尋大量索引時。