As visões gerais de IA do Google alucinaram mais do que Ken Kesey quando foi lançado pela primeira vez em 2024, fabricando fatos sobre respingar “cola na pizza”, entre outras ofensas.
E embora a tecnologia alimentada pelo Gemini tenha melhorado drasticamente sua precisão nos últimos dois anos (infelizmente para os editores), as visões gerais da IA ainda erram em questões básicas. E isso inclui testes de ortografia.
As visões gerais de IA do Google desencadeiam investigação antitruste pelo uso de conteúdo de editores
As ferramentas de IA do Google continuam péssimas em responder perguntas sobre ortografia, tendo ido viral há dois anos por responder à pergunta “quantos r tem a palavra morango?” incorretamente. Mas ainda é ruim. Na terça-feira, Usuário X Naomi Rohatyn testou a capacidade atual do modelo de linguagem grande (LLM) de responder a uma questão ortográfica.
“Quantos e tem a palavra astronômico?” eles perguntaram.
“Existem exatamente 2 ‘e’s na palavra” astronômico “(astrenomicael)”, respondeu AI Overview.
Este Tweet não está disponível no momento. Pode estar carregando ou foi removido.
Nós mesmos tentamos, obtendo a mesma resposta.
Velocidade da luz mashável
Ah, errado.
Crédito: Google/Mashable
Parece funcionar para qualquer palavra com quatro ou mais sílabas:

Não.
Crédito: Google/Mashable

Incorreto.
Crédito: Google/Mashable
Basta dizer que as pessoas estão tendo outra rodada alegre de testes da fraqueza ortográfica da tecnologia, compartilhando suas descobertas nas redes sociais.
Este Tweet não está disponível no momento. Pode estar carregando ou foi removido.
Este Tweet não está disponível no momento. Pode estar carregando ou foi removido.
Este Tweet não está disponível no momento. Pode estar carregando ou foi removido.
Por que as visões gerais de IA do Google não podem ser escritas corretamente?
Eu não quero ser tudo Concurso de ortografia de Billy Madison sobre isso, mas considerando que os usuários estão menos probabilidade de clicar em links quando um resumo de IA aparece nos resultados, certamente as informações fornecidas nas Visões Gerais de IA devem ser precisas. Mas é complicado.
Os chatbots de IA precisam de contexto e detalhes exatos para responder da melhor maneira possível, portanto, certamente soletrar palavras em seus dados de treinamento parece fácil. No entanto, as coisas ficam complicadas quando você pede a um LLM para considerar as palavras letra por letra, pois o modelo processará o texto em pedaços em vez de caracteres individuais (é chamado tokenização).
Pensei em perguntar ao próprio Gemini do Google para ver o que ele tinha a dizer sobre si mesmo. Defenda sua ortografia incorreta!
“A resposta curta é que não vejo nem escrevo textos como você”, disse-me Gemini. “Quando você escreve a palavra ‘maçã’, seu cérebro processa cinco letras distintas. Quando leio ou escrevo um texto, vejo a palavra como uma unidade única chamada token (uma representação numérica de uma palavra ou parte de uma palavra).
“Como eu processo as palavras como blocos inteiros de significado, em vez de sequências de letras individuais, não ‘soletro’ naturalmente as palavras sequencialmente. Sei exatamente o que ‘maçã’ significa e como se relaciona com outras palavras, mas não o faço inerentemente foco no fato de que contém dois ‘p’s, a menos que seja especificamente solicitado a dividi-lo. “
Mashable entrou em contato com o Google para comentários humanos.













