Sintaxis del argumento de búsqueda
>>-+---------------------------------------------------------+--> '-THESAURUS--"nombre-tesauro"--+-----------------------+--' '-COUNT--"profundidad"--' >-----+-----------------------+---------------------------------> '-RESULT LIMIT--número--' >-----+-| argumento-booleano |--+-------------------------------+------------------------------------------------------+> | '-&--| argumento-texto-libre |--' | | .-& o |--------------------. | | V | | '----| argumento-atributo |---+--+-------------------------------------------------+--| argumento-texto-libre |--' '-(Nota: & está implícito)--| argumento-booleano |--' >-------------------------------------------------------------->< argumento-booleano .-& o |-------------------------------------------------------------------. V | |-----+-| factor-búsqueda |------------------------------------------------+--+-> | .-----------------------------------. | | V | | '-(--| factor-búsqueda |------+- & -+---| factor-búsqueda |---+---)--' '- | -' >---------------------------------------------------------------| argumento-atributo |---+-------------------------------------------------------------------------------------+-> | .-,-----------------. | | V | | '-+----------------+---+-SECTION--+--(-----nombre-sección---+---)----| comparación |--' '-MODEL--modelo--' '-SECTIONS-' >---------------------------------------------------------------| Comparación |---+---------------------------------+-------------------------| '-=-->=--<=-->--<--valor-atributo--' argumento-texto-libre |---IS ABOUT----+-----------------+---+---------+---------------> +-SYNONYM FORM OF-+ '-idioma--' +-característica--+ '-| tesauro |-----' >----"frase-o-sentencia"----+-----------------------+-----------| '-ESCAPE--"car-escape"--' factor-búsqueda |---+-------------------------------------------------------------------+-> | .-,-----------------. | | V | | '-+----------------+---+-SECTION--+--(-----nombre-sección---+---)---' '-MODEL--modelo--' '-SECTIONS-' >---| elemento-búsqueda |---------------------------------------| elemento-búsqueda |---+-+-----+--| búsqueda-primaria |-------------------------------------+-> | '-NOT-' | | .-AND----------------. | | V | | '-| b.-primaria |--+-IN SAME PARAGRAPH AS-+------| b.-primaria |---+-' '-IN SAME SENTENCE AS-' >---------------------------------------------------------------| búsqueda-primaria |---+-| búsqueda-átomo |----------------+-----------------------| | .-,---------------------. | | V | | '-(-----| búsqueda-átomo |---+---)--' búsqueda-átomo |---+-----------------------------------+---+---------+---------> +-PRECISE FORM OF-------------------+ '-idioma--' +-STEMMED FORM OF-------------------+ +-FUZZY FORM OF--nivel-comparación--+ +-SYNONYM FORM OF-------------------+ +-BOUND-----------------------------+ +-SOUNDS LIKE-----------------------+ +-característica--------------------+ '-| tesauro |-----------------------' >----"palabra-o-frase"----+----------------------------+--------| '-ESCAPE--"carácter-escape"--' tesauro (si se especifica THESAURUS) |---+---------------------+---TERM OF---------------------------| '-EXPAND--"relación"--'
Ejemplos
Se proporcionan ejemplos en el apartado Especificación de los argumentos de búsqueda.
Parámetros de búsqueda
Una opción que le permite especificar un argumento de búsqueda de texto libre, es decir, una frase o sentencia en un idioma natural que describe el concepto que se ha de buscar. Consulte el apartado Búsqueda de texto libre e híbrida.
El nombre de modelo debe especificarse en un archivo de modelos de documentos descrito en el apartado Trabajar con documentos estructurados (soporte de secciones). El nombre de modelo puede enmascararse con caracteres comodín.
Si no especifica ningún modelo, se utiliza el modelo por omisión especificado al crear el índice.
Una palabra clave utilizada para especificar una o varias secciones a las que se restringe la búsqueda. Debe especificarse el nombre de sección en un modelo de un archivo de modelos de documentos, descrito en el apartado Trabajar con documentos estructurados (soporte de secciones). Un nombre de sección puede enmascararse utilizando los caracteres comodín % y _.
Las secciones pueden anidarse dentro de otras secciones, por ejemplo:
play/Act/Title=play/act/title
Restricciones: La búsqueda en secciones anidadas sólo es posible para los documentos almacenados en columnas habilitadas con el formato XML. Para los índices Ngram, sólo puede buscarse en un nombre de sección y el formato XML no está soportado.
Un valor utilizado junto con un operador de comparación precedente para los atributos listados en la lista de secciones precedente. Una consulta que pide que un valor de atributo esté dentro de un rango determinado puede utilizar dos operadores de comparación en una condición de atributo.
Una combinación de operadores que utiliza la misma clase de comparación (como >= en el primero y > en el segundo) de la misma condición no es válida. La especificación de dos comparaciones con el operador = tampoco es válida.
Las secciones pueden anidarse dentro de otras secciones, por ejemplo:
play/Act/Title=play/act/title
Restricciones: La búsqueda en secciones anidadas sólo es posible para los documentos almacenados en columnas habilitadas con el formato XML. Para los índices Ngram, sólo puede buscarse en un nombre de sección y el formato XML no está soportado.
Una palabra clave utilizada para especificar el nombre del tesauro utilizado para ampliar el término de búsqueda. El nombre de tesauro es el nombre de archivo (sin su extensión) de un tesauro que se ha compilado utilizando el compilador de tesauro TXTHESC o TXTHESN. Existen los tesauros por omisión desthes y desnthes, almacenados en el directorio de ejemplo, donde desnthes es un tesauro Ngram. También puede especificar el nombre de vía de acceso del archivo. El nombre de vía de acceso por omisión es la vía de acceso del diccionario.
Una palabra clave utilizada para especificar el número de niveles (la profundidad) de los términos del tesauro que se han de utilizar para ampliar el término de búsqueda para una relación determinada. Si no especifica esta palabra clave, se supone una cuenta de 1.
Una palabra clave utilizada para especificar el número máximo de entradas que se han de devolver en la lista de resultados. número es un valor de 1 a 32767. Si se utiliza una búsqueda de texto libre, sólo se establece el rango de la lista de resultados de la búsqueda con respecto a la lista de resultados de búsqueda completa. De lo contrario, sólo se establece el rango del resultado limitado de la búsqueda a partir de las entradas de la lista.
Se utiliza una palabra clave para especificar la relación como, por ejemplo, INSTANCE, entre el término de búsqueda especificado en TERM OF y los términos del tesauro que se han de utilizar para ampliar el término de búsqueda. El nombre de la relación debe corresponder a la relación utilizada en el tesauro. Consulte el apartado Conceptos del tesauro.
Para un tesauro Ngram, utilice el nombre de relación de miembros descrito en el apartado Creación de un tesauro Ngram. Para las relaciones de miembros definidas por el usuario, utilice :RELATION n donde n es el número de relación de miembros especificado en :RELATED (número).
El término de búsqueda, o término de búsqueda de múltiples palabras, al que los demás términos de búsqueda se han de añadir desde el tesauro.
El operador lógico AND (&) tiene una vinculación superior al operador lógico OR (|). Ejemplo:
"pasajero" & "vehículo" | "transporte" & "público"
se evalúa como:
("pasajero" & "vehículo") | ("transporte" & "público")
Para buscar:
"pasajero" & ("vehículo" | "transporte") & "público"
debe incluir los paréntesis que aparecen aquí.
Cuando se utiliza NOT en un factor de búsqueda, no puede utilizar la palabra clave SYNONYM FORM OF.
El siguiente argumento de búsqueda busca documentos de texto que contienen el término "tráfico" sólo si el término "aéreo" está en el mismo párrafo.
"tráfico" IN SAME PARAGRAPH AS "aéreo"
No puede utilizar la palabra clave IN SAME PARAGRAPH AS cuando se utiliza NOT como factor de búsqueda.
El siguiente argumento de búsqueda busca "bosque", "lluvia", "erosión" y "tierra" en la misma sentencia.
"bosque" IN SAME SENTENCE AS "lluvia" AND "erosión" AND "tierra"
La sentencia siguiente es verdadera si se encuentran uno o varios argumentos de búsqueda.
CONTAINS (mytexthandle, '( "texto", "gráfico", "audio", "vídeo")') = 1
El proceso del término de búsqueda se describe con más detalle en la Tabla 8.
Tabla 7. Opciones lingüísticas
Palabra clave de átomo de búsqueda | Tipo de índice | ||||
Lingüístico | Exacto | Exacto normalizado | Ngram | Ngram sensible a las mayúsculas y minúsculas | |
PRECISE FORM OF |
| X | X |
| O |
STEMMED FORM OF | X |
|
| O | O |
FUZZY FORM OF |
|
|
| O | O |
IS ABOUT | O | O | O |
|
|
SYNONYM FORM OF | O | O | O |
|
|
EXPAND | O | O | O |
|
|
SOUNDS LIKE | O | O | O |
|
|
IN SAME SENTENCE AS | O | O | O | O | O |
IN SAME PARAGRAPH AS | O | O | O | O | O |
BOUND |
|
|
| O | O |
X=valor por omisión O=función disponible |
Tabla 8. Opciones de término de búsqueda para índices Ngram
Palabra clave de átomo de búsqueda | Proceso de término de búsqueda | ||||
---|---|---|---|---|---|
Mayúsculas/minúsculas | Reducción a la raíz | Coincidencia | |||
Sensible | No sensible | Exacta | Similar | ||
PRECISE FORM OF | cuando se habilitan las mayúsculas y minúsculas | X |
| X |
|
STEMMED FORM OF |
| X | X |
|
|
FUZZY FORM OF |
| X |
|
| X |
X=valor por omisión |
Si utiliza una palabra clave que no está disponible para este tipo de índice, se pasa por alto y se utiliza la palabra clave por omisión en su lugar o se devuelve un mensaje.
Esta es la opción por omisión para los índices exactos. Para un índice exacto normalizado, el formato por omisión de la búsqueda no es sensible a las mayúsculas y minúsculas. Si especifica esta palabra clave para un índice lingüístico, se pasa por alto y se asume STEMMED FORM OF.
La manera en que estas palabras se reducen a su raíz depende del idioma.
Ejemplo: programming computer systems se sustituye por program compute system cuando se utiliza un diccionario inglés de EE.UU y por programme compute system cuando se utiliza un diccionario inglés del Reino Unido.
Esta frase de búsqueda puede encontrar "programmer computes system", "program computing systems", "programming computer system", etcétera.
Esta es la opción por omisión para los índices lingüísticos. Si especifica esta palabra clave para un índice exacto, se pasa por alto y en su lugar se asume PRECISE FORM OF.
nivel-comparación: Un entero de 1 a 5 que especifica el grado de similitud, donde 5 es más similar que 1.
Los sinónimos para una frase son frases alternativas que contienen todas las combinaciones posibles de sinónimos que pueden obtenerse sustituyendo cada palabra de la frase original por uno de sus sinónimos. El orden de las palabras permanece igual que en la frase original.
Si especifica esta palabra clave para un índice exacto, se pasa por alto y en su lugar se asume PRECISE FORM OF.
No puede especificar esta palabra clave cuando se utiliza NOT en el factor de búsqueda o cuando la palabra o frase que se ha de buscar contiene caracteres de máscara.
El proceso lingüístico incluye el proceso de sinónimos y el proceso de palabras raíz.
Los idiomas soportados se listan en la Tabla 5.
Nota: | Cuando se busca en documentos que no están en inglés de EE.UU, debe especificar el idioma del argumento de búsqueda sin tener en cuenta el idioma por omisión. |
Búsqueda exacta o lingüística. DB2 Text Extender puede buscar utilizando el formato exacto de la palabra o frase, o una variación de la misma. Si no especifica ninguna de las opciones de la Tabla 7, se utilizan las opciones de lingüísticas por omisión de acuerdo al tipo de índice que se utiliza.
Para buscar una serie de caracteres que contiene comillas dobles, escriba las comillas dobles dos veces. Por ejemplo, para buscar el texto carácter "comodín", utilice:
"carácter ""comodín"""
Enmascaramiento de caracteres. Una palabra puede contener los siguientes caracteres de máscara:
Una palabra no puede estar compuesta exclusivamente de caracteres de máscara, excepto cuando se utiliza un solo % para representar una palabra opcional.
Si utiliza un carácter de máscara, no puede utilizar SYNONYM OF, característica ni THESAURUS.
Ejemplo: Si carácter-escape es $, entonces $%, $_ y $$ representan %, _ y $ respectivamente. Cualquier carácter % y _ no precedido por $ representan caracteres de máscara.
Resumen de las normas y restricciones