Criação e Acesso a Informação Semântica Aplicada ao Governo Eletrónico
2011; University of Minho; Volume: 3; Issue: 2 Linguagem: Português
10.21814/lm.3.2.101
ISSN1647-0818
AutoresMário Rodrigues, Gonçalo Paiva Dias, António Teixeira,
Tópico(s)Data Mining Algorithms and Applications
ResumoOs cidadaos, empresas ou servicos publicos - os clientes - que procuram informacoes no contexto do Governo Eletronico visam obter respostas objetivas as suas questoes. Para isso e necessario que os sistemas de pesquisa consigam manipular a informacao de modo a que seja disponibilizada de uma forma eficaz e adequada as necessidades de cada cliente. Uma vez que grande parte dos documentos do governo estao escritos em formatos nao estruturados e em linguagem natural, e necessario desenvolver metodos para obter e estruturar este tipo de informacao. A alternativa seria indexar pelo seu texto a grande quantidade de documentos existente, uma solucao desadequada no contexto do Governo Eletronico, uma vez que assim seriam retornados frequentemente muitos resultados a cada pesquisa.Este artigo apresenta um primeiro prototipo de uma aplicacao que gera informacao semântica a partir de textos escritos em Portugues. A informacao semântica gerada corresponde a um dominio de conhecimento definido por um operador humano atraves de uma interface grafica, de modo a que o sistema seja adaptavel as diferentes areas de atuacao do Governo Eletronico. O conteudo e acessivel atraves de uma interface em linguagem natural e atraves de uma interface de pesquisa que aceita entradas SPARQL. Deste modo e possivel aos clientes aceder diretamente ou integrar este sistema com os seus proprios sistemas de informacao. A aplicacao esta organizada em tres grandes modulos: Representacao do Conhecimento que permite definir dominio de conhecimento e sua semântica e criar exemplos semente, nos textos, de conceitos do dominio de conhecimento; Processamento de Linguagem Natural que permite obter estruturas sintaticas associadas as frases em linguagem natural; e Extracao e Integracao Semântica que utiliza os exemplos semente para treinar classificadores estatisticos a identificar nas estruturas sintaticas os conceitos do dominio de conhecimento, que utiliza os classificadores treinados para detetar esses conceitos em estruturas sintaticas de novas frases, e que contem as interfaces para pessoas e maquinas.Neste artigo apresentamos igualmente exemplos ilustrativos da utilizacao do sistema e os resultados de uma primeira avaliacao de desempenho. O sistema funciona para o Portugues e foi construido reutilizando software do estado da arte, maioritariamente desenvolvido visando o Ingles. A sua modularidade permite alterar a lingua base do sistema, de Portugues para outra, alterando o modulo de Processamento de Linguagem Natural e sem ser necessario alterar os restantes modulos da aplicacao.
Referência(s)