Información colocacional y recuperación de la información
2003; Technical University of Valencia; Volume: 31; Issue: 31 Linguagem: Espanhol
ISSN
1135-5948
AutoresMargarita Alonso Ramos, Leo Wanner,
Tópico(s)Topic Modeling
ResumoEste proyecto tiene como objetivo investigar la significacion de la informacion colocacional en Recuperacion de la informacion (RI). Una colocacion es una relacion entre dos unidades lexicas (UL) L1 y L2 tal que para expresar un significado especifico en relacion con L1 la eleccion de L2 no es libre (Mel' uk 1995). Asi, para expresar el sentido 'hacer lo que esta previsto que se debe hacer' en relacion con la UL CARGO, podemos decir desempenar un cargo. El mismo sentido predicado de PROMESA se expresaria por CUMPLIR y en combinacion con SECRETO, por GUARDAR. El peso semantico de L1 y L2 no esta equilibrado: mientras L1 (la base de la colocacion) guarda el sentido que tiene cuando no esta en colocacion, el significado de L2 (el colocativo) esta reducido o modificado cuando aparece en colocacion Las siguientes propiedades de las colocaciones las hacen interesantes para RI: 1) A la hora de indexar un texto, los elementos de una colocacion no pueden ser considerados como terminos aislados: es evidente que la aportacion de ABANDONAR en abandono al nino, donde la UL es usada libremente, no es la misma que la aportada en la colocacion abandono el cargo; 2) Una base dada puede formar varias colocaciones con el mismo significado. Asi, el nombre CARGO no solo selecciona ABANDONAR, sino tambien RENUNCIAR, DIMITIR (de) o CESAR (en). 3) Las colocaciones pueden der clasificadas segun una tipologia semanticamente motivada. Nuestra hipotesis es que estas propiedades deben tener ciertos efectos en los resultados de la RI. A pesar de que en los ultimos anos se registra una fuerte tendencia a utilizar informacion linguistica para RI, no se han explorado hasta ahora las colocaciones. La razon se debe a que no existia ningun procedimiento fiable de reconocimiento automatico de colocaciones en los documentos. Sin embargo, algunos trabajos previos basados en la tipologia de las funciones lexicas (FL) (Wanner y Alonso 2001 y Wanner en preparacion) han mostrado la posibilidad de identificar automaticamente colocaciones verbo-nombre. Actualmente hemos extendido el mismo enfoque para reconocer colocacaciones nombre-adjetivo y verbo-adverbio. En nuestra investigacion sobre RI, usamos esta estrategia para la identificacion de colocaciones tanto en los documentos como en las consultas de los usuarios y pretendemos usar la informacion colocacional para mejorar los resultados de RI.
Referência(s)