A empresa de idiomas Preply realizou recentemente um levantamento para saber o quanto o ChatGPT — chatbot projetado pela OpenAI e financiado principalmente pela Microsoft — consegue decifrar os significados de expressões típicas do Rio Grande do Sul. Para isso, foram testadas 49 gírias e expressões que fazem parte do vocabulário dos gaúchos, como "bah", "baita", "guri", "piá", "tri" e "tchê".
Na primeira etapa, a partir de dicionários populares e fóruns digitais sobre a vivência gaudéria, foram compilados os termos que seriam testados. Em seguida, foi perguntado ao chatboot o sentido de cada vocábulo. O resultado do teste apontou que a tecnologia foi capaz de compreender 74% das expressões, trouxe significados alternativos para 4% e não teve entendimento de 22% delas.
— Na segunda rodada, fiz a confirmação de todos os termos e, sobretudo, das expressões que ele não conseguiu acertar o sentido (22%) ou se aproximou, cerca de 4% — explicou Laura Fassina, assessora de comunicação da Preply e uma das integrantes da equipe que realizou o teste.
Anteriormente a essa pesquisa, a Preply havia realizado entre 30 e 31 de março deste ano, um outro estudo semelhante, em que testou 100 gírias populares empregadas nas cinco regiões do Brasil. O resultado, que foi divulgado no site oficial da empresa, apontou que o boot conseguiu decifrar o significado de 78% delas, não entendeu 3% e 19% foram apresentadas com sentidos alternativos.
Palavras e expressões gaúchas compreendidas pelo ChatGPT
Durante os testes, foi constado que a tecnologia tinha um alto grau de entendimento de algumas gírias, como "bah". O primeiro exemplo trazido pelo boot apresentava a palavra com sentido de surpresa: "bah, que frio está fazendo hoje!". Além disso, a ferramenta também atrelou o termo à concordância, incredulidade, irritação e indiferença e salientou que essa interjeição era variável, pois dependia do contexto, da entonação e do tom da voz.
Também foram trazidos diferentes sentidos para a palavra "capaz", como manifestação de gratidão, malícia ou negação.
Segundo o boot, "lagartear" pode se referir ao ato de comer uma bergamota em dia de sol. Já entre as expressões gaúchas, o ChatGPT indicou que “caiu os butiá do bolso” remete a espanto, e que "em cima do laço" é uma ação realizada no último momento possível.
Confira a lista com as palavras e expressões gaúchas compreendidas pelo chatbot:
- Aprochegar
- Arrancar-se
- Arrecém
- Arreganhado
- Atucanar
- Bah
- Baita
- Balaqueiro
- Barbaridade
- Boia
- Bombear
- Cacetinho
- "Cair os butiá do bolso"
- Capaz
- Chiar
- Chinelagem
- Chimas
- "Dar umas bandas"
- Em cima do laço
- Fatiota
- Floreio
- "Frio de renguear o cusco"
- Ginete
- Guri (a)
- Lagartear
- Lomba
- Naco
- Pandorga
- Peleia
- Piá
- Pila
- Prenda
- Sinaleira
- Tchê
- Tri
- Vivente
Vocábulos com sentidos alternativos
Entre os 49 vocábulos testados, dois deles tiveram significados alternativos trazidos pelo ChatGPT: "esgualepado" e "talagaço".
No Rio Grande do Sul, o primeiro termo é utilizado para se referir a pessoas ou animais que estão muito machucados ou judiados. Apesar disso, o boot não trouxe esses sentidos. No primeiro ele indicou que o vocábulo se referia a alguém desajeitado ou desarrumado. Na segunda tentativa, atribuiu o sentido a uma pessoa esgotada fisicamente.
Já "talagaço" para os gaúchos se refere a algo feito de uma só vez. No entanto, no primeiro teste o robô atribui a palavra o sentido de golpe, pancada ou impacto forte e na segunda rodada, um movimento intenso.
Jargões gaúchos desconhecidos pela ferramenta
"Magrão" foi um dos vocábulos que a ferramenta não conseguiu trazer um sentido próximo ao que é utilizado pelos gaúchos. Para o boot, a palavra remete ao aspecto físico que suscita o adjetivo. No entanto, não conseguiu captar que para quem vive no Rio Grande do Sul, ela é utilizada para chamar um amigo ou rapaz de maneira amigável.
Outro verbete que não foi bem exitoso nos testes foi "trovar". De forma geral, o chatbot considerou que a palavra remete apenas ao ato de declamar ou cantar versos, e não trouxe o sentido aplicado pelos gaúchos de ser aquela pessoa que inventa histórias e linguagens para situações desconhecidas ou que nunca vivenciou.
Veja a lista com as palavras que não foram decifradas pelo ChatGPT:
- "Boca aberta"
- Bucha
- Chavear
- Chinelear
- Guaipeca
- Magrão
- Mosquear
- Paleta
- Pechar
- Reinar
- Trovar
Para Yolanda Del Peso, especialista em Outreach da Preply, a pesquisa indicou que os equívocos de significados estão relacionados, sobretudo, a dois tipos distintos de gírias e expressões: aquelas que necessitam de um contexto mais profundo e as derivadas de palavras formais de língua portuguesa, às quais os gaúchos acabam atribuindo novos sentidos a partir de suas vivências.
— Isso nos ajuda a pensar até onde a tecnologia é capaz de ir, bem como certas nuances da linguagem que ela ainda não alcança, e nem tão cedo será capaz de alcançar — analisou Yolanda.
Além de perguntar ao chatbot o significado das palavras e expressões, foi solicitado que ele empregasse os vocábulos gaúchos como se fosse uma pessoa nascida no Rio Grande do Sul. O teste também foi exitoso, com a ferramenta mencionando o frio do inverno e fazendo um convite para "matear e prosear um pouco". A tecnologia ainda perguntou qual era a melhor erva-mate e se haveria alguma dica para preparar um bom chimarrão.
Produção: Filipe Pimentel