SiRILiCO uma proposta para um sistema de recuperação de Informação baseado em teorias da lingüística computacional e ontologia
2008; Universidade Federal de Minas Gerais, Escola de Ciência da Informação; Volume: 10; Issue: 2 Linguagem: Português
ISSN
1981-5344
Autores Tópico(s)Linguistics and Language Studies
ResumoEste trabalho apresenta estudos para a administracao de documentos eletronicos atraves de um embasamento cognitivista. Propoe-se uma indexacao de textos eletronicos, disponibilizados em lingua portuguesa, por meio da aplicacao de teorias de linguistica computacional e utilizacao de ontologia. A tecnica empregada para a indexacao e baseada principalmente na teoria de Analise Proposicional proposta por Frederiksen (1975). E baseada na extracao de etiquetas sintaticas das palavras que compoem os documentos para a geracao de etiquetas semânticas dessas palavras, para entao gerar uma ontologia leve automaticamente. Ao longo deste trabalho sao sugeridas varias contribuicoes, que visam otimizar o desempenho de Sistemas de Recuperacao de Informacao, por meio da utilizacao de tecnicas que permitam contextualizar as palavras dos textos a serem indexados. Tais contribuicoes incluem desde a otimizacao de analisadores sintaticos, ate a geracao automatica de ontologias leves. Inicialmente um corpus, que e uma pequena colecao de documentos eletronicos sobre Ciencia da Informacao, escritos em lingua portuguesa e disponibilizados na Web, foi criada. Esta colecao foi utilizada para testar o prototipo construido. O prototipo, nomeado SiRILiCO (Sistema de Recuperacao de Informacao baseado em Teorias da Linguistica Computacional e Ontologia), foi utilizado em um experimento-piloto e posteriormente em outro experimento, com o intuito de verificar e validar a hipotese de que e possivel desenvolver e implementar um Sistema de Recuperacao de Informacao totalmente baseado em teorias linguisticas, teorias de linguistica computacional e ontologia. Os resultados de precisao e revocacao dos experimentos realizados com o SiRILiCO sao comparados com os resultados obtidos com a utilizacao de um modelo vetorial. A analise dos resultados sugere que nao so e viavel a hipotese defendida como tambem e muito promissora.
Referência(s)