Artigo Acesso aberto Produção Nacional

Web scraping em dados públicos: método para extração de dados dos gastos públicos dos vereadores da câmara municipal de Belo Horizonte

2021; UNIVERSIDADE ESTADUAL DE LONDRINA; Volume: 26; Issue: 4 Linguagem: Português

10.5433/1981-8920.2021v26n4p319

ISSN

1981-8920

Autores

Wendel Vilaça de Assis, João Victor Boechat Gomide,

Tópico(s)

Data Quality and Management

Resumo

Objetivo: Demonstração que o método de web scraping na linguagem de programação python é capaz de extrair e transformar os dados desestruturados de custeio parlamentar do portal de transparência da Câmara Municipal de Belo Horizonte, em dados abertos estruturados. Metodologia: Está apoiada em pesquisa bibliográfica de dados públicos da Câmara Municipal de Belo Horizonte (CMBH), sob o ponto de vista de dados abertos no contexto da LAI, e análise qualitativa na extração de dados via web scraping. Resultados: Demonstra a eficácia do método de web scraping na extração de dados e na transformação em dados abertos estruturados. Isso permite o compartilhamento dos dados, possibilitando a produção de novas soluções para o protótipo de Chat Bot Sumé, apresentado neste trabalho. Conclusão: Eficácia do novo método de web scraping para extração de dados, seguida de manipulação para transformá-los em dados abertos, bem como apresentação do protótipo Chat Bot Sumé.

Referência(s)
Altmetric
PlumX