Documentation
(C) IBM Corp. 1996, 2000

DB2 Text Extender Administración y programación


Proceso lingüístico para examen

El proceso lingüístico también se utiliza al examinar documentos que se han encontrado después de una búsqueda. Se realiza en dos etapas:

  1. Análisis básico del texto: normalización y ampliación de términos
  2. Comparación ampliada.

Etapa 1: Normalización y ampliación de términos

La primera etapa se realiza sin utilizar ningún diccionario electrónico.

Normalización

La normalización se describe en el apartado Análisis básico de texto.

Ampliación de términos

La ampliación de términos es lo contrario a la reducción de un término a su formato base. Si el índice es lingüístico, los términos de búsqueda se reducen a su formato base antes de que empiece la búsqueda.

De manera similar, si tiene un índice lingüístico, los términos de los documentos se reducen a su formato base antes de añadirlos al índice. Por lo tanto, los documentos se encuentran en base a un formato base del término.

Sin embargo, cuando examina un documento encontrado, espera ver resaltadas todas las variantes del formato base. Para resaltar estas variantes, se expande el término base encontrado.

Se pueden producir todas las variantes (inflexiones) para el término de búsqueda encontrado en los diccionarios. Estas son las inflexiones producidas para la palabra en alemán gehen (ir):

gegangen  geh    gehe    gehen    gehend  gehest  gehet  gehst
ging      ginge  gingen  gingest  ginget  gingst  gingt  geht

Etapa 2: Comparación ampliada

La segunda etapa es la comparación ampliada, que puede utilizarse en raras ocasiones cuando el análisis básico de texto y la normalización no pueden resaltar un término encontrado. La comparación ampliada encuentra las coincidencias más difíciles.

Puede elegir la comparación ampliada especificando DES_EXTENDED como parámetro de la función API DesOpenDocument.

La comparación ampliada utiliza el mismo proceso lingüístico que se realiza durante la indexación lingüística.

Estas son las ocasiones en las que la comparación ampliada puede encontrar coincidencias adicionales:


[ Principio de página | Página anterior | Página siguiente | Contenido | Índice ]