Artigo Produção Nacional

Identificação automática de termos de domínio do consumidor em saúde

2019; Volume: 11; Issue: 4 Linguagem: Português

ISSN

2175-4411

Autores

Josceli Maria Tenório, Ivan Torres Pisa,

Tópico(s)

Lexicography and Language Studies

Resumo

Objetivo: Deste estudo e descrever um processo de identificacao automatica de termos candidatos a partir de conteudos disponiveis na web para fins de construcao de um CHV no idioma portugues-brasileiro. Metodo: Inicialmente realizou-se recuperacao de conteudos da web, especificamente por meio de noticias curtas provenientes de feeds Really Simple Syndication (RSS). Como segunda etapa foram organizados vocabularios de controle baseados em CID-10 e Wikipedia, e finalmente foram aplicadas tecnicas de analise de textos para fins de identificacao e classificacao de termos candidatos. Resultados: Foram recuperados 128 termos por meio do vocabulario controlado CID-10. O vocabulario Wikipedia resultou em 411 termos distintos. Os termos foram classificados utilizando a metrica estatistica tf-idf possibilitando uma analise de sua relevância. Conclusao: A utilizacao e analise de conteudos jornalisticos disponiveis na web podem apoiar significativamente o desenvolvimento de um CHV.

Referência(s)