Documentation
(C) IBM Corp. 1996, 2000

DB2 Text Extender Administración y programación


Archivo de configuración de análisis de prueba

Nombre de archivo
DESTAF.TCF

Ubicación
UNIX: DB2TX_INSTOWNERHOMEDIR/db2tx/TXINSnnn

Windows NT y Windows 2000: %DMBMMPATH%\instancia\%DB2INSTANCE%\db2tx\txinsnnn Este archivo sólo existe una vez por instancia del servidor.

El archivo de configuración de análisis de prueba contiene secciones para el proceso de actualización y de consulta de cada tipo de índice, excepto los índices ngram. Sólo debe cambiar las opciones descritas aquí. Si cambia cualquiera de las demás entradas, puede conducir a errores durante el proceso de actualización o de consulta.

Opciones comunes

Las opciones siguientes se aplican a:


Opción Valor por omisión Descripción
FilterSet Ninguno, obligatorio Nombre de la sección del archivo de configuración que contiene las normas para las palabras de parada, por ejemplo, StwUseAllUpCs, StwIgnAllUpCs.
Normalize No Especifica si se lleva a cabo la normalización en el índice.

Si se establece en sí, la normalización convierte todos los caracteres a minúsculas y sustituye los caracteres diacríticos por caracteres base.

Si se establece en No, se pasan por alto las entradas para NormalizeUmlauts y ConvertAllUpperToLower.

NormalizeUmlauts Especifica si se han de sustituir las diéresis, por ejemplo, ä por ae. Esto sólo se aplica a los documentos en alemán, danés, sueco o noruego.
ConvertAllUpperToLower No Especifica que las palabras con todas las letras en mayúsculas se convierten a minúsculas.

[TAF_Filter:STWUSEALLUPCS] [TAF_Filter:STWIGNALLUPCS]

Las opciones de estas secciones describen los conjuntos de filtros de palabras de parada. La sección [TAF_Filter:STWUSEALLUPCS] trata las palabras con todas las letras escritas en mayúsculas como palabras en mayúsculas y minúsculas [TAF_Filter:STWIGNALLUPCS] define un trato especial para las palabras con todas las letras escritas en mayúsculas.
Opción Valor por omisión Descripción
FilterType TAF_FILTER_STW La sección del archivo de configuración que contiene las normas para el filtro de palabras de parada.
MinTokenLength 3 El número mínimo de caracteres necesario para una señal. Si la longitud de la señal es menor que este valor, no se indexará. Es un valor entero >= 1.
MinUpperCaseTokenLength 2 El número mínimo de caracteres necesario para una señal con todas las letras en mayúsculas. Si la longitud de la señal es menor que este valor, no se indexará. Es un valor entero >= 1.
UseAlternateTerritories No Especifica si se ha de utilizar un diccionario alternativo para el proceso de palabras de parada si no se puede encontrar el diccionario específico del idioma.

Si se establece en sí, se utiliza el primer diccionario de palabras de parada que coincide con el idioma. Por ejemplo, si el idioma actual es en-gb pero no hay ningún archivo de palabras de parada en-gb.tsw, se utiliza el archivo de palabras de parada en-us.tsw.

Si se establece en no, no se efectúa el filtro de palabras de parada.

[TAF_AnnotationType:TAF_ThesaurusEntry ]

Esta sección establece los valores por omisión para las consultas que necesitan la ampliación del tesauro.
Palabra clave Valor por omisión Descripción
ThesBaseName desthes Establece el nombre por omisión del tesauro utilizado para las consultas que necesitan la ampliación de la consulta. El nombre es una serie de caracteres.
Depth 1 Establece la vía de acceso por omisión para atravesar el tesauro utilizado para consultas que necesitan la ampliación del tesauro. Es un valor entero >= 1.

[TAF_PlugIn:TAF_POE ]

Para cambiar el valor por omisión para el entorno de idioma que está precargado cuando se inicia Aplicación Text Search, puede definir un idioma en la opción PreloadLanguages.
Opción Valor por omisión Descripción
PreloadLanguages EN-US Especifica un conjunto de recursos específicos de idioma que se han de precargar en el arranque. Por ejemplo, si una aplicación se utiliza en documentos en italiano, se cargan los recursos para el italiano. El valor del campo toma el formato XX-YY donde XX es el idioma e YY es el territorio.


[ Principio de página | Página anterior | Página siguiente | Contenido | Índice ]