El proceso lingüístico también se utiliza al examinar documentos que se han encontrado después de una búsqueda. Se realiza en dos etapas:
La primera etapa se realiza sin utilizar ningún diccionario electrónico.
La normalización se describe en el apartado Análisis básico de texto.
La ampliación de términos es lo contrario a la reducción de un término a su formato base. Si el índice es lingüístico, los términos de búsqueda se reducen a su formato base antes de que empiece la búsqueda.
De manera similar, si tiene un índice lingüístico, los términos de los documentos se reducen a su formato base antes de añadirlos al índice. Por lo tanto, los documentos se encuentran en base a un formato base del término.
Sin embargo, cuando examina un documento encontrado, espera ver resaltadas todas las variantes del formato base. Para resaltar estas variantes, se expande el término base encontrado.
Se pueden producir todas las variantes (inflexiones) para el término de búsqueda encontrado en los diccionarios. Estas son las inflexiones producidas para la palabra en alemán gehen (ir):
gegangen geh gehe gehen gehend gehest gehet gehst ging ginge gingen gingest ginget gingst gingt geht
La segunda etapa es la comparación ampliada, que puede utilizarse en raras ocasiones cuando el análisis básico de texto y la normalización no pueden resaltar un término encontrado. La comparación ampliada encuentra las coincidencias más difíciles.
Puede elegir la comparación ampliada especificando DES_EXTENDED como parámetro de la función API DesOpenDocument.
La comparación ampliada utiliza el mismo proceso lingüístico que se realiza durante la indexación lingüística.
Estas son las ocasiones en las que la comparación ampliada puede encontrar coincidencias adicionales:
Los caracteres de máscara se procesan y se realiza una reducción a la raíz para el término de búsqueda y se encuentran los términos correspondientes. Sin la comparación ampliada, no se resaltaría el texto que coincide con los criterios de búsqueda especificados.
Ejemplo: Un documento contiene el término inflexado juegan.
Cuando un documento en un idioma germánico contiene una palabra compuesta y se indexa utilizando un índice lingüístico, el índice del documento conserva las partes de la palabra compuesta y la palabra compuesta en sí. Cuando busca una parte de una palabra compuesta, se encuentran los documentos que contienen la palabra compuesta, pero sin la comparación ampliada la palabra no se resalta.
Ejemplo: Un documento contiene la palabra en alemán Apfelbaum (literalmente, árbol de manzanas).
Si el procesador de texto inserta automáticamente los guiones, se puede encontrar y resaltar la palabra con el guión. Sin embargo, si el guión lo escribe el usuario, se encuentran los documentos que contienen la palabra, pero sin la comparación ampliada la palabra no se resalta.
Ejemplo: Un documento contiene la palabra con guión contenedor, separada al final de una línea de la siguiente manera:
Otro nombre para una carpeta es un con- tenedor.