Um leitor de Luanda, Rosário K., pergunta quantos vocábulos uma pessoa deve saber para se considerar fluente em língua portuguesa. Já escrevi várias vezes sobre este tema, mas jamais poderia deixar sem resposta uma consulta tão especial assim, vinda do outro lado do Atlântico, e para isso compartilho com ele uma conversação que tive há alguns anos com meu amigo Jerônimo Teixeira, jornalista e escritor cujo nome dispensa apresentações. Intrigado com a afirmação de um jornalista americano sobre o tamanho do vocabulário usual dos falantes nativos do Inglês, que ele estimava em 200.000 palavras, contra 184.000 dos alemães e 100.000 dos franceses, Jerônimo perguntou se eu conhecia alguma estimativa semelhante sobre o número de vocábulos de uso comum no nosso idioma.
A resposta é simples: como nas pesquisas pré-eleitorais, tantas respostas teremos quantas pesquisas houver. Nunca haverá consenso entre os especialistas quanto à quantidade de palavras que um falante padrão domina. Para começar, é necessário distinguir aquelas que ele consegue reconhecer quando as vê escritas — o chamado vocabulário passivo — daquelas que consegue mobilizar para uso, quando vai escrever — o seu vocabulário ativo. Este sempre será muito inferior ao primeiro, como sabe qualquer estudante de uma língua estrangeira; na hora de falar ou escrever, as palavras que normalmente reconhecemos desaparecem como as baratas na cozinha, quando acendemos a luz, e se reduzem drasticamente.
Além disso, pesam aqui as diferenças geográficas, etárias, etc., já que é natural que uma pessoa de 60 anos conheça muito mais palavras que um adolescente e que um morador de São Paulo tenha um vocabulário muito mais amplo que um seringueiro. O que mais ocasiona diferentes resultados na contagem, porém, é a dificuldade de chegar a um consenso sobre o que seja um vocábulo. Uns incluem aqui os nomes próprios (das ciências, da geografia, das artes), outros não; uns contam como vocábulo o que outros consideram apenas uma locução (estrada de ferro, procurador de justiça, ponto e vírgula, etc.); há os que consideram itens distintos as formas diferentes dos verbos irregulares (por exemplo, fui, vou e irei contam como três ou são consideradas apenas como variantes do verbo ir?). É um cipoal dos infernos.
Quem deu uma estimativa surpreendente pela moderação foi Antônio Houaiss, que falou, num artigo de 1975, que nosso idioma teria aproximadamente 350.000 vocábulos (mais ou menos como o Inglês, acrescenta ele), frisando que o vocabulário usual ficaria entre dez a vinte por cento disso, já que o restante pertence àquele fundo comum da ciência e da tecnologia, que todas as línguas usam, mas que não fazem parte do léxico habitual dos falantes. Portanto, fazendo um calculozinho básico sobre esses números houaissianos, poderíamos dizer que o vocabulário geral, mesmo, ficaria lá pelos 40.000
vocábulos.
Eu, de minha parte, tenho trabalhado com uma estimativa global de 500.000 vocábulos (fora os potenciais, que estão sempre em estado virtual, esperando o momento de se apresentar à luz do sol: se temos disponibilizar, podemos ter disponibilizável, disponibilização, etc.). Desses 500.000, um lexicógrafo deve conhecer umas 100.000; eu imagino reconhecer uns 80.000; uma pessoa com curso superior e cultura razoável, entre 40 e 50.000; um estudante universitário, também com razoável leitura, entre 30 e 40.000; um adolescente ligadão em tevê e internet, mas interessado por leitura, entre 20 e 30.000 — e assim vai descendo a escala, até chegar aos 2000 que todos mais ou menos aceitam como patamar básico de uma pessoa que não recebeu qualquer educação formal.
Machado de Assis, o gênio, escreveu Dom Casmurro usando menos de 8.000 palavras diferentes, e compôs toda sua obra com aproximadamente 12.000 vocábulos, enquanto Coelho Netto (autor menor e ilegível) teria empregado mais de 35.000 palavras diferentes na sua longa e obscura carreira — o que certamente contém uma lição para os que querem ser escritores. Por tudo isso, caro Rosário, fica uma grande certeza: sempre haverá uma pesquisa apresentando números diferentes, mas ela estará, como todas, baseada em critérios que poderão ser contestados na primeira esquina.