IR-n un sistema de recuperación de información basado en pasajes
2003; Technical University of Valencia; Volume: 30; Issue: 30 Linguagem: Espanhol
ISSN
1135-5948
Autores Tópico(s)Educational Technology in Learning
ResumoEn este trabajo se ha presentado un nuevo modelo de Recuperacion de Informacion basado en pasajes. A este sistema se le ha denominado IR-.n. El principal objetivo de los sistemas de RI es localizar los documentos que son relevantes a una pregunta. Para determinar esta relevancia los sistemas de RI buscan los terminos de la pregunta dentro del documento y posteriormente utilizan unas metricas adicionales para valorar dichar relevancia. Los sistemas de RI basados en pasajes (RP) realizan dicha busqueda en unos fragmentos de texto contiguo denominados pasajes. El sistema IR-n define un nuevo modelo de pasajes y una serie de metricas que permiten mejorar la eficacia del proceso. La evaluacion del sistema IR-n se realizo en las conferencias CLEF. El sistema IR-n, es un modelo de RP, que diferencia claramente del resto, principalmente, por la unidad que utiliza para definir los pasajes en los que se divide el documento: la frase. Se han analizado las ventajas que supone el uso de la frase como unidad de definicion de los paisajes, dentro de la problematica de la RI. Las principales son: * Los limites que definen una frase dentro de un documento se pueden obtener facilmente aunque no se disponga de marcas en el documento que las identifiquen. * Los pasajes generados en base a un numero de frases, estan dotados de entidad sintactica. Esta caracteristica ha sido de gran utilidad en el uso del sistema como paso previo a la aplicacion de un sistema de Busqueda de Respuestas (BR). * Permiten incorporar de forma sencilla el concepto de solapamiento en la definicion de los pasajes. * Permite valorar, en el calculo de relevancia, el hecho de que los terminos que forman la pregunta aparezcan en una misma unidad como es la frase. Las principales aportaciones de este trabajo son las siguientes: * Estudio y clasificacion de los sistemas de RI mas importantes. * Propuesta de un nuevo modelo de RP. * Evaluaci
Referência(s)