Corpus psicolinguístico Léxico do Português Brasileiro
2017; UNIVERSIDADE DO ESTADO DO RIO DE JANEIRO; Issue: 33 Linguagem: Português
10.12957/soletras.2017.29702
ISSN2316-8838
AutoresGustavo Lopez Estivalet, Fanny Meunier,
Tópico(s)Linguistics and Education Research
ResumoO Léxico do Português Brasileiro foi desenvolvido com o objetivo de oferecer um corpus baseado em palavras para a pesquisa em psicolinguística no português brasileiro. Ele foi criado a partir de um corpus com mais de 32 milhões de palavras. Assim, o Léxico do Português Brasileiro contém mais de 215 mil entradas lexicais e apresenta 21 colunas com informações metalinguísticas e psicolinguísticas relevantes, como categoria gramatical, frequência ortográfica, número de letras, vizinhos ortográficos, entre outras. Ele é um corpus aberto e de livre acesso na internet, possuindo uma plataforma amigável e dinâmica para pesquisas simples e complexas. O Léxico do Português Brasileiro ainda disponibiliza uma série de dados já computados, oferece um motor de geração de pseudopalavras do português brasileiro e um conjunto de ferramentas de linguística e estatística. Sendo assim, o presente artigo tem como objetivo introduzir e apresentar o Léxico do Português Brasileiro, e servir como seu manual de utilização. Ainda, é realizada uma descrição do desenvolvimento e criação do corpus . Enfim, o Léxico do Português Brasileiro preenche uma enorme lacuna na pesquisa em psicolinguística e linguística computacional, oferecendo um corpus baseado em palavras com valiosas informações metalinguísticas e psicolinguísticas do português brasileiro. http://dx.doi.org/10.12957/soletras.2017.29702
Referência(s)