
Identificação automática de termos de domínio do consumidor em saúde
2019; Volume: 11; Issue: 4 Linguagem: Português
ISSN
2175-4411
AutoresJosceli Maria Tenório, Ivan Torres Pisa,
Tópico(s)Lexicography and Language Studies
ResumoObjetivo: Deste estudo e descrever um processo de identificacao automatica de termos candidatos a partir de conteudos disponiveis na web para fins de construcao de um CHV no idioma portugues-brasileiro. Metodo: Inicialmente realizou-se recuperacao de conteudos da web, especificamente por meio de noticias curtas provenientes de feeds Really Simple Syndication (RSS). Como segunda etapa foram organizados vocabularios de controle baseados em CID-10 e Wikipedia, e finalmente foram aplicadas tecnicas de analise de textos para fins de identificacao e classificacao de termos candidatos. Resultados: Foram recuperados 128 termos por meio do vocabulario controlado CID-10. O vocabulario Wikipedia resultou em 411 termos distintos. Os termos foram classificados utilizando a metrica estatistica tf-idf possibilitando uma analise de sua relevância. Conclusao: A utilizacao e analise de conteudos jornalisticos disponiveis na web podem apoiar significativamente o desenvolvimento de um CHV.
Referência(s)