A face quantitativa da linguagem: um dicionário de freqüências do português
1998; UNIVERSIDADE EST.PAULISTA JÚLIO DE MESQUITA FILHO; Volume: 42; Issue: 1 Linguagem: Português
ISSN
1981-5794
AutoresMaría Tereza Camargo Biderman,
Tópico(s)linguistics and terminology studies
ResumoO Dicionario de Frequencias do lexico do portugues brasileirocontemporâneo baseou-se num corpus de lingua escrita, variedade brasileirade 5 milhoes de palavras (1950 a 1990). Alguns resultados quantitativos:apenas 42.212 unidades lexicas diferentes totalizaram os 5 milhoes de ocorrenciasdo corpus, excluidos toponimos e antroponimos. Os dados estatisticosdo dicionario registram altissima frequencia das palavras instrumentais(artigos, preposicoes, pronomes, conjuncoes etc.) bem como de verbos auxiliarese modalizadores. O mesmo ocorre com palavras de significacao muito geral, arquilexemas, altamente polissemicos. Na vertente oposta estao as palavras de baixa frequencia sobretudo os hapax legomena , que contribuemmacicamente para o total de 42.212 lexias registradas neste corpus. De fato,as palavras de baixa frequencia totalizam grande parte desse index verborum ;caso contrario, o repertorio vocabular seria muito menor. A categoria substantivo contribui com a maioria de vocabulos que ocorreram apenas uma vez no corpus , assim como os tecnicismos da linguagem cientifica. O vocabulario jornalistico e o mais neutro e o menos tematico, constituindo uma especiede media entre os outros generos de linguagem.
Referência(s)