Documentation
(C) IBM Corp. 1996, 2000

DB2 Text Extender Administración y programación

Argumento de búsqueda

Sintaxis del argumento de búsqueda

>>-+---------------------------------------------------------+-->
   '-THESAURUS--"nombre-tesauro"--+-----------------------+--'
                                  '-COUNT--"profundidad"--'
 
>-----+-----------------------+--------------------------------->
      '-RESULT LIMIT--número--'
 
>-----+-| argumento-booleano |--+-------------------------------+------------------------------------------------------+>
      |                         '-&--| argumento-texto-libre |--'                                                      |
      |  .-& o |--------------------.                                                                                  |
      |  V                          |                                                                                  |
      '----| argumento-atributo |---+--+-------------------------------------------------+--| argumento-texto-libre |--'
                                       '-(Nota: & está implícito)--| argumento-booleano |--'
 
>--------------------------------------------------------------><
 
argumento-booleano
 
    .-& o |-------------------------------------------------------------------.
    V                                                                         |
|-----+-| factor-búsqueda |------------------------------------------------+--+->
      |                         .-----------------------------------.      |
      |                         V                                   |      |
      '-(--| factor-búsqueda |------+- & -+---| factor-búsqueda |---+---)--'
                                    '- | -'
 
>---------------------------------------------------------------|
 
argumento-atributo
 
|---+-------------------------------------------------------------------------------------+->
    |                                       .-,-----------------.                         |
    |                                       V                   |                         |
    '-+----------------+---+-SECTION--+--(-----nombre-sección---+---)----| comparación |--'
      '-MODEL--modelo--'   '-SECTIONS-'
 
>---------------------------------------------------------------|
 
Comparación
 
|---+---------------------------------+-------------------------|
    '-=-->=--<=-->--<--valor-atributo--'
 
argumento-texto-libre
 
|---IS ABOUT----+-----------------+---+---------+--------------->
                +-SYNONYM FORM OF-+   '-idioma--'
                +-característica--+
                '-| tesauro |-----'
 
>----"frase-o-sentencia"----+-----------------------+-----------|
                            '-ESCAPE--"car-escape"--'
 
factor-búsqueda
 
|---+-------------------------------------------------------------------+->
    |                                       .-,-----------------.       |
    |                                       V                   |       |
    '-+----------------+---+-SECTION--+--(-----nombre-sección---+---)---'
      '-MODEL--modelo--'   '-SECTIONS-'
 
>---| elemento-búsqueda |---------------------------------------|
 
elemento-búsqueda
 
|---+-+-----+--| búsqueda-primaria |-------------------------------------+->
    | '-NOT-'                                                            |
    |                                             .-AND----------------. |
    |                                             V                    | |
    '-| b.-primaria |--+-IN SAME PARAGRAPH AS-+------| b.-primaria |---+-'
                       '-IN SAME SENTENCE  AS-'
 
>---------------------------------------------------------------|
 
búsqueda-primaria
 
|---+-| búsqueda-átomo |----------------+-----------------------|
    |    .-,---------------------.      |
    |    V                       |      |
    '-(-----| búsqueda-átomo |---+---)--'
 
búsqueda-átomo
 
|---+-----------------------------------+---+---------+--------->
    +-PRECISE FORM OF-------------------+   '-idioma--'
    +-STEMMED FORM OF-------------------+
    +-FUZZY FORM OF--nivel-comparación--+
    +-SYNONYM FORM OF-------------------+
    +-BOUND-----------------------------+
    +-SOUNDS LIKE-----------------------+
    +-característica--------------------+
    '-| tesauro |-----------------------'
 
>----"palabra-o-frase"----+----------------------------+--------|
                          '-ESCAPE--"carácter-escape"--'
 
tesauro (si se especifica THESAURUS)
 
|---+---------------------+---TERM OF---------------------------|
    '-EXPAND--"relación"--'
 

Ejemplos

Se proporcionan ejemplos en el apartado Especificación de los argumentos de búsqueda.

Parámetros de búsqueda

IS ABOUT

Una opción que le permite especificar un argumento de búsqueda de texto libre, es decir, una frase o sentencia en un idioma natural que describe el concepto que se ha de buscar. Consulte el apartado Búsqueda de texto libre e híbrida.

MODEL modelo
Una palabra clave utilizada para especificar el nombre del modelo de documento que se ha de utilizar en el término de búsqueda. El modelo de documento describe la estructura de los documentos que contienen secciones identificables para que pueda buscarse individualmente en el contenido de estas secciones.

El nombre de modelo debe especificarse en un archivo de modelos de documentos descrito en el apartado Trabajar con documentos estructurados (soporte de secciones). El nombre de modelo puede enmascararse con caracteres comodín.

Si no especifica ningún modelo, se utiliza el modelo por omisión especificado al crear el índice.

SECTION(S) nombre-sección

Una palabra clave utilizada para especificar una o varias secciones a las que se restringe la búsqueda. Debe especificarse el nombre de sección en un modelo de un archivo de modelos de documentos, descrito en el apartado Trabajar con documentos estructurados (soporte de secciones). Un nombre de sección puede enmascararse utilizando los caracteres comodín % y _.

Las secciones pueden anidarse dentro de otras secciones, por ejemplo:

play/Act/Title=play/act/title

Restricciones: La búsqueda en secciones anidadas sólo es posible para los documentos almacenados en columnas habilitadas con el formato XML. Para los índices Ngram, sólo puede buscarse en un nombre de sección y el formato XML no está soportado.

<valor-atributo

Un valor utilizado junto con un operador de comparación precedente para los atributos listados en la lista de secciones precedente. Una consulta que pide que un valor de atributo esté dentro de un rango determinado puede utilizar dos operadores de comparación en una condición de atributo.

Una combinación de operadores que utiliza la misma clase de comparación (como >= en el primero y > en el segundo) de la misma condición no es válida. La especificación de dos comparaciones con el operador = tampoco es válida.

=
Pide una comparación de igualdad de un atributo en el documento indexado con el valor de atributo siguiente.

>=
Pide una comparación "mayor que o igual a" del atributo del documento indexado con el valor del atributo siguiente.

>
Pide una comparación "mayor que" del atributo del documento indexado con el valor del atributo siguiente.

<=
Pide una comparación "menor que o igual a" del atributo del documento indexado con el valor del atributo siguiente.

<
Pide una comparación "menor que" del atributo del documento indexado con el valor del atributo siguiente.

Las secciones pueden anidarse dentro de otras secciones, por ejemplo:

play/Act/Title=play/act/title

Restricciones: La búsqueda en secciones anidadas sólo es posible para los documentos almacenados en columnas habilitadas con el formato XML. Para los índices Ngram, sólo puede buscarse en un nombre de sección y el formato XML no está soportado.

THESAURUS nombre-tesauro

Una palabra clave utilizada para especificar el nombre del tesauro utilizado para ampliar el término de búsqueda. El nombre de tesauro es el nombre de archivo (sin su extensión) de un tesauro que se ha compilado utilizando el compilador de tesauro TXTHESC o TXTHESN. Existen los tesauros por omisión desthes y desnthes, almacenados en el directorio de ejemplo, donde desnthes es un tesauro Ngram. También puede especificar el nombre de vía de acceso del archivo. El nombre de vía de acceso por omisión es la vía de acceso del diccionario.

COUNT profundidad

Una palabra clave utilizada para especificar el número de niveles (la profundidad) de los términos del tesauro que se han de utilizar para ampliar el término de búsqueda para una relación determinada. Si no especifica esta palabra clave, se supone una cuenta de 1.

RESULT LIMIT número

Una palabra clave utilizada para especificar el número máximo de entradas que se han de devolver en la lista de resultados. número es un valor de 1 a 32767. Si se utiliza una búsqueda de texto libre, sólo se establece el rango de la lista de resultados de la búsqueda con respecto a la lista de resultados de búsqueda completa. De lo contrario, sólo se establece el rango del resultado limitado de la búsqueda a partir de las entradas de la lista.

EXPAND relación

Se utiliza una palabra clave para especificar la relación como, por ejemplo, INSTANCE, entre el término de búsqueda especificado en TERM OF y los términos del tesauro que se han de utilizar para ampliar el término de búsqueda. El nombre de la relación debe corresponder a la relación utilizada en el tesauro. Consulte el apartado Conceptos del tesauro.

Para un tesauro Ngram, utilice el nombre de relación de miembros descrito en el apartado Creación de un tesauro Ngram. Para las relaciones de miembros definidas por el usuario, utilice :RELATION n donde n es el número de relación de miembros especificado en :RELATED (número).

TERM OF "palabra-o-frase"

El término de búsqueda, o término de búsqueda de múltiples palabras, al que los demás términos de búsqueda se han de añadir desde el tesauro.

factor-búsqueda
Un operando que puede combinarse con otros operandos para formar un argumento de búsqueda. El orden de la evaluación es de izquierda a derecha.

El operador lógico AND (&) tiene una vinculación superior al operador lógico OR (|). Ejemplo:

     "pasajero" & "vehículo" | "transporte" & "público"

se evalúa como:

     ("pasajero" & "vehículo") | ("transporte" & "público")

Para buscar:

     "pasajero" & ("vehículo" | "transporte") & "público"

debe incluir los paréntesis que aparecen aquí.

NOT búsqueda-primaria

Un operador que le permite excluir los documentos de texto de la búsqueda que contienen un término en particular.

Cuando se utiliza NOT en un factor de búsqueda, no puede utilizar la palabra clave SYNONYM FORM OF.

búsqueda-primaria IN SAME PARAGRAPH AS búsqueda-primaria

Una palabra clave que el permite buscar una combinación de términos que aparecen en el mismo párrafo.

El siguiente argumento de búsqueda busca documentos de texto que contienen el término "tráfico" sólo si el término "aéreo" está en el mismo párrafo.

     "tráfico" IN SAME PARAGRAPH AS "aéreo"

No puede utilizar la palabra clave IN SAME PARAGRAPH AS cuando se utiliza NOT como factor de búsqueda.

búsqueda-primaria IN SAME SENTENCE AS búsqueda-primaria

Una palabra clave que le permite buscar una combinación de términos que aparecen en la misma sentencia. Similar a IN SAME PARAGRAPH AS.

AND búsqueda-primaria

Una palabra clave que le permite combinar varias búsquedas primarias para buscar en la misma sentencia o el mismo párrafo.

El siguiente argumento de búsqueda busca "bosque", "lluvia", "erosión" y "tierra" en la misma sentencia.

     "bosque" IN SAME SENTENCE AS "lluvia" AND "erosión" AND "tierra"

búsqueda-átomo
Si conecta una serie de átomos de búsqueda mediante comas, una búsqueda será satisfactoria si se encuentra un término de cualquiera de los átomos de búsqueda. Cada átomo de búsqueda debe contener como mínimo una palabra o una frase.

La sentencia siguiente es verdadera si se encuentran uno o varios argumentos de búsqueda.

     CONTAINS (mytexthandle, '( "texto",
                                "gráfico",
                                "audio",
                                "vídeo")') = 1

PRECISE FORM OF, STEMMED FORM OF, FUZZY FORM OF, SYNONYM FORM OF, BOUND

La Tabla 7 muestra las opciones que corresponden a los diferentes tipos de índice. Por ejemplo, para un índice lingüístico, cualquiera de las opciones son correctas excepto PRECISE FORM OF. Si especifica PRECISE FORM OF, se pasa por alto y se toma el valor por omisión.

El proceso del término de búsqueda se describe con más detalle en la Tabla 8.

Tabla 7. Opciones lingüísticas
Palabra clave de átomo de búsqueda Tipo de índice
Lingüístico Exacto Exacto normalizado Ngram Ngram sensible a las mayúsculas y minúsculas
PRECISE FORM OF
X X
O
STEMMED FORM OF X

O O
FUZZY FORM OF


O O
IS ABOUT O O O

SYNONYM FORM OF O O O

EXPAND O O O

SOUNDS LIKE O O O

IN SAME SENTENCE AS O O O O O
IN SAME PARAGRAPH AS O O O O O
BOUND


O O
X=valor por omisión O=función disponible


Tabla 8. Opciones de término de búsqueda para índices Ngram
Palabra clave de átomo de búsqueda Proceso de término de búsqueda
Mayúsculas/minúsculas Reducción a la raíz Coincidencia
Sensible No sensible Exacta Similar
PRECISE FORM OF cuando se habilitan las mayúsculas y minúsculas X
X
STEMMED FORM OF
X X

FUZZY FORM OF
X

X
X=valor por omisión

Si utiliza una palabra clave que no está disponible para este tipo de índice, se pasa por alto y se utiliza la palabra clave por omisión en su lugar o se devuelve un mensaje.

PRECISE FORM OF
Una palabra clave que hace que se busque la palabra (o cada palabra de la frase) que sigue a PRECISE FORM OF exactamente tal como se ha escrito, en lugar de reducirse primero a su formato raíz. Para los índices exactos, este formato de búsqueda es sensible a las mayúsculas y minúsculas; es decir, el uso de letras en mayúsculas o en minúsculas es significativo. Por ejemplo, si busca ratón no encontrará "Ratón".

Esta es la opción por omisión para los índices exactos. Para un índice exacto normalizado, el formato por omisión de la búsqueda no es sensible a las mayúsculas y minúsculas. Si especifica esta palabra clave para un índice lingüístico, se pasa por alto y se asume STEMMED FORM OF.

STEMMED FORM OF
Una palabra clave que hace que la palabra (o cada palabra de la frase) que sigue a STEMMED FORM OF se reduzca a su raíz antes de que se lleve a cabo la búsqueda. Este formato de búsqueda no es sensible a las mayúsculas y minúsculas. Por ejemplo si busca ratón encontrará "Ratón".

La manera en que estas palabras se reducen a su raíz depende del idioma.

Ejemplo: programming computer systems se sustituye por program compute system cuando se utiliza un diccionario inglés de EE.UU y por programme compute system cuando se utiliza un diccionario inglés del Reino Unido.

Esta frase de búsqueda puede encontrar "programmer computes system", "program computing systems", "programming computer system", etcétera.

Esta es la opción por omisión para los índices lingüísticos. Si especifica esta palabra clave para un índice exacto, se pasa por alto y en su lugar se asume PRECISE FORM OF.

FUZZY FORM OF
Una palabra clave para realizar una búsqueda "similar" de términos que se escriben de forma similar al término de búsqueda. Esto es especialmente útil al buscar en documentos que se han creado por un programa de reconocimiento óptico de caracteres (OCR). Estos documentos incluyen con frecuencia palabras escritas incorrectamente. Por ejemplo, un programa OCR podría reconocer la palabra economía como econonía.

nivel-comparación: Un entero de 1 a 5 que especifica el grado de similitud, donde 5 es más similar que 1.

SYNONYM FORM OF
Una palabra clave que hace que se busque la palabra o frase que sigue a SYNONYM FORM OF junto con sus sinónimos. Los sinónimos los proporciona el diccionario especificado por idioma o sino por el diccionario por omisión.

Los sinónimos para una frase son frases alternativas que contienen todas las combinaciones posibles de sinónimos que pueden obtenerse sustituyendo cada palabra de la frase original por uno de sus sinónimos. El orden de las palabras permanece igual que en la frase original.

Si especifica esta palabra clave para un índice exacto, se pasa por alto y en su lugar se asume PRECISE FORM OF.

No puede especificar esta palabra clave cuando se utiliza NOT en el factor de búsqueda o cuando la palabra o frase que se ha de buscar contiene caracteres de máscara.

BOUND
Una palabra clave para buscar en documentos que utilizan el CCSID coreano. Hace que la búsqueda respete los límites de la frase o palabra. Si se especifica idioma, se pasa por alto; se asume el coreano.

idioma
Una variable que determina el diccionario que se utiliza en el proceso lingüístico de los documentos de texto durante la indexación y recuperación. Esto no sólo se aplica a los índices lingüísticos, sino también a los índices exactos porque utilizan un diccionario para procesar las palabras de parada.

El proceso lingüístico incluye el proceso de sinónimos y el proceso de palabras raíz.

Los idiomas soportados se listan en la Tabla 5.
Nota:Cuando se busca en documentos que no están en inglés de EE.UU, debe especificar el idioma del argumento de búsqueda sin tener en cuenta el idioma por omisión.

"palabra-o-frase"
Una palabra o frase que se ha de buscar. Los caracteres que se pueden utilizar en una palabra dependen del idioma. También depende del idioma si se deben separar las palabras por caracteres separadores. Para el inglés y la mayoría de los demás idiomas, cada palabra de una frase debe ir separada por un carácter en blanco.

Búsqueda exacta o lingüística. DB2 Text Extender puede buscar utilizando el formato exacto de la palabra o frase, o una variación de la misma. Si no especifica ninguna de las opciones de la Tabla 7, se utilizan las opciones de lingüísticas por omisión de acuerdo al tipo de índice que se utiliza.

Para buscar una serie de caracteres que contiene comillas dobles, escriba las comillas dobles dos veces. Por ejemplo, para buscar el texto carácter "comodín", utilice:

"carácter ""comodín"""

Enmascaramiento de caracteres. Una palabra puede contener los siguientes caracteres de máscara:

_ (subrayado)
Representa un carácter cualquiera.

% (porcentaje)
Representa cualquier número arbitrario de caracteres. Si una palabra consiste en un solo %, representa una palabra opcional de cualquier longitud.

Una palabra no puede estar compuesta exclusivamente de caracteres de máscara, excepto cuando se utiliza un solo % para representar una palabra opcional.

Si utiliza un carácter de máscara, no puede utilizar SYNONYM OF, característica ni THESAURUS.

ESCAPE carácter-escape
Un carácter que identifica el siguiente carácter como uno que se ha de buscar y no uno utilizado como carácter de máscara.

Ejemplo: Si carácter-escape es $, entonces $%, $_ y $$ representan %, _ y $ respectivamente. Cualquier carácter % y _ no precedido por $ representan caracteres de máscara.

Resumen de las normas y restricciones

Operaciones booleanas
NOT no está permitido después de OR.

FUZZY FORM OF
Los 3 primeros caracteres deben coincidir. No se puede utilizar si una palabra del átomo de búsqueda contiene un carácter de máscara. No se puede utilizar en combinación con NOT. Sólo puede utilizarse con un índice Ngram.

IN SAME PARAGRAPH AS
No puede utilizarse si se utiliza NOT en un factor de búsqueda.

IN SAME SENTENCE AS
No puede utilizarse si se utiliza NOT en un factor de búsqueda.

Índice lingüístico
Impide la utilización de PRECISE FORM OF. Toma por omisión STEMMED FORM OF. Pueden utilizarse caracteres de máscara. Las búsquedas no son sensibles a las mayúsculas y minúsculas.

Carácter de máscara
Impide la utilización de SYNONYM FORM OF y THESAURUS.

Índice Ngram
Pueden utilizarse caracteres de máscara, aunque no después de un carácter no alfanumérico. Las búsquedas no son sensibles a las mayúsculas y minúsculas a menos que se habiliten las mayúsculas/minúsculas del índice y se utilice PRECISE FORM OF.

NOT
Impide la utilización de SYNONYM FORM OF, IN SAME PARAGRAPH AS e IN SAME SENTENCE AS.

PRECISE FORM OF
Se pasa por alto para un índice lingüístico.

Índice exacto
Impide la utilización de STEMMED FORM OF y SYNONYM FORM OF. Toma por omisión PRECISE FORM OF. Pueden utilizarse caracteres de máscara. Las búsquedas son sensibles a las mayúsculas y minúsculas.

STEMMED FORM OF
Se pasa por alto para un índice exacto, pero está disponible para un índice exacto normalizado que contiene documentos en inglés.

SYNONYM FORM OF
No se puede utilizar si una palabra del átomo de búsqueda contiene un carácter de máscara. No se puede utilizar en combinación con NOT. No se puede utilizar con un índice exacto.


[ Principio de página | Página anterior | Página siguiente | Contenido | Índice ]