Início Tecnologia Os agentes de IA precisam de mais do que raciocínio: eles precisam...

Os agentes de IA precisam de mais do que raciocínio: eles precisam realmente usar an internet

22
0

Uma empresa lança um assistente de atendimento ao cliente de IA. O modelo por trás disso é atual e capaz o suficiente para o trabalho. O assistente entra ao vivo. Dentro de uma semana, os tickets de suporte estão piorando, e não melhorando.

O modelo não é o problema. O próprio web site da empresa é. A política de devolução que o assistente precisa citar está em um PDF. A calculadora de remessa que precisa ser consultada é um formulário de várias etapas. As especificações do produto que devem ser obtidas ficam atrás de uma interface com guias que só carrega após um clique. Para um visitante humano, o web site funciona bem. Para a IA que tenta lê-lo, metade do web site não existe.

Este é o muro que a maioria das implantações de IA estão atingindo no momento e não tem quase nada a ver com o modelo.

Relatório sobre o estado da IA ​​de 2025 da McKinsey descobriram que 23% das organizações estão agora escalando sistemas de IA de agência em pelo menos uma função de negócios, com outros 39% experimentando. A maioria dessas implantações ocorrerá na mesma parede: uma net projetada para humanos, usada por software program que precisa de algo que os humanos nunca precisaram. O próximo passo para os agentes de IA não é um raciocínio mais inteligente. É a capacidade de realmente navegar e usar a Web ao vivo.

As três coisas que um agente de IA deve fazer na net

O trabalho se divide em três empregos, e todos os três precisam trabalhar para que um agente seja útil na produção.

Procurar. O agente precisa encontrar as informações corretas. Não URLs para uma lista de hyperlinks, mas conteúdo actual que ele pode ler e raciocinar. Se um cliente perguntar a um chatbot de seguro se sua apólice cobre um evento específico, o agente precisará exibir a seção relevante da apólice, não uma página de resultados de pesquisa.

Raspar. Assim que o agente encontrar a página, ele precisará lê-la de forma limpa. A maioria dos websites modernos não facilita isso. As páginas são carregadas por meio de JavaScript que deve ser executado primeiro. O conteúdo fica dentro de acordeões expansíveis, guias e seções de carregamento lento. O HTML que o agente recebe geralmente não se parece em nada com o que um ser humano vê em seu navegador.

Interagir. É aqui que a maioria das demonstrações de agentes desmorona na produção. Muitas das informações com as quais os humanos se preocupam não estão em um simples URL. Está atrás de um botão “carregar mais”, uma caixa de pesquisa, um formulário de várias etapas, um menu de navegação ou um login. Um raspador que só consegue ler páginas estáticas não consegue alcançar nada disso. Um agente que pode interagir (clicar, navegar, preencher, enviar) pode. A diferença entre os dois determina se a IA pode realmente fazer o seu trabalho.

Dos três, a interação é a mais nova e a mais difícil. É também onde residem os aplicativos de agente mais úteis: assistentes de compras que comparam preços entre websites, ferramentas de pesquisa que extraem dados de painéis interativos, bots de suporte ao cliente que navegam em portais de documentação da mesma forma que um usuário actual faria.

Firecrawl está construindo a camada abaixo

Fogo de artifício é uma das empresas que constrói infraestrutura projetada para apoiar todas as três funções. A plataforma fica entre os agentes de IA e an internet ativa, lidando com pesquisa, coleta e interação como recursos gerenciados por trás de uma única API. Isso é projeto de código aberto tem mais de 120.000 estrelas no GitHub. Clientes como Lovable, Replit e Zapier o utilizam na produção. Nexus Enterprise Companions liderou o US$ 14,5 milhões Série A em 2025, com o CEO do Shopify, Tobi Lütke, ingressando como investidor após usar o Firecrawl pela primeira vez como cliente.

A proposta é direta: um agente de IA construído sobre o Firecrawl não precisa que sua equipe de desenvolvimento escreva código personalizado para cada web site que acessa. Ele chama uma API, e a plataforma cuida de grande parte do trabalho técnico subjacente: renderização de JavaScript, navegação em páginas dinâmicas, interação com elementos e retorno de resultados estruturados que os sistemas de IA podem usar.

“Toda empresa de IA precisava de dados da net limpos e ninguém estava resolvendo isso bem”, diz Eric Ciarla, um dos cofundadores da Firecrawl. “Então construímos o Firecrawl.”

Ciarla e seus cofundadores enfrentaram o problema diretamente ao construir sua empresa anterior, a Mendable, uma plataforma de pesquisa de IA usada por diversas organizações. O produto de pesquisa funcionou. A infraestrutura que extraía dados do web site de cada cliente para alimentá-los, não o fez. Cada nova integração significava reconstruir o código de extração frágil que quebraria na próxima vez que o web site do cliente fosse alterado. Mendable não period incomum em atingir aquela parede. Muitas empresas de IA que integram dados da net enfrentaram desafios semelhantes, reconstruindo repetidamente ferramentas de extração interna.

Como a IA está se tornando a nova forma como as pessoas encontram as coisas

Há uma mudança acontecendo junto com a técnica, e isso muda o que está em jogo para as empresas que ainda não pensaram na leitura de seus websites por agentes de IA.

Durante duas décadas, o caminho de “um cliente está procurando algo” até “um cliente encontra sua empresa” muitas vezes passou por mecanismos de busca tradicionais. Os assistentes de IA estão cada vez mais onde as pessoas começam quando desejam uma recomendação, uma comparação ou uma resposta. O assistente de IA sai, extrai informações dos websites relevantes em nome da pessoa e volta com uma resposta sintetizada. Se a IA não conseguir analisar seu web site, sua empresa não aparecerá na resposta.

Ciarla argumenta que isso muda totalmente a forma como as empresas deveriam pensar sobre os rastreadores de IA. “Atrás de cada agente de IA está um humano tentando encontrar algo”, diz ele. O enquadramento dominante da indústria tratou os rastreadores de IA como uma automação indesejada: bots contra os quais se defender, tráfego que drena recursos do servidor sem enviar visitantes humanos em troca. Esse enquadramento fazia sentido quando a única coisa que leia websites em grande escala eram os mecanismos de pesquisa que indexavam visitantes humanos posteriormente. Faz menos sentido quando os agentes de IA são o caminho que o ser humano usa para encontrar.

Na opinião de Ciarla, bloquear rastreadores de IA hoje pode ser comparável a limitar a visibilidade em um canal de descoberta emergente. Ele argumenta que isso poderia reduzir as oportunidades de encontrar empresas por meio da evolução dos comportamentos de busca dos clientes.

O que torna incomum a posição da Firecrawl nessa mudança é que ela não exige que as empresas façam nada. A maioria das abordagens para a visibilidade da IA ​​coloca o trabalho sobre o proprietário do web site: adicionar nova marcação, expor novos endpoints, reestruturar páginas, aprender uma nova disciplina de otimização além da existente de website positioning. Firecrawl funciona na direção oposta. A plataforma lida com a conversão entre websites legíveis por humanos e dados legíveis por máquinas automaticamente, em tempo actual. Uma empresa nunca precisa saber que os agentes de IA estão lendo a página. Os agentes conseguem o que precisam de qualquer maneira.

A maior questão por baixo

À medida que os agentes extraem mais informações de mais websites, a relação entre os sistemas de IA e as fontes das quais dependem torna-se uma questão actual. Um modelo em que a IA extrai valor do conteúdo da net sem que nada retorne às pessoas que o criaram não é durável. Os editores estão resistindo a ações judiciais e bloqueios de acesso, e os principais websites estão cada vez mais isolando totalmente seu conteúdo dos rastreadores de IA. O ecossistema subjacente não é saudável e o custo a longo prazo acaba por chegar a algum lado.

Em março de 2026, Firecrawl parceria com a Wikimedia Enterprise encaminhar todo o tráfego da Wikipédia – 2 a 3 milhões de solicitações por mês – através das APIs comerciais da Wikimedia, em vez de continuar a copiar páginas da Wikipédia diretamente. O acordo substitui a extração intensiva de recursos por acesso estruturado e pago e ajuda a apoiar a comunidade voluntária que mantém uma das fontes de informação mais citadas na net aberta.

“Os membros da comunidade que escrevem e editam esses artigos detêm um poder imenso na period da IA”, disse Ciarla quando a parceria foi anunciada. “Eles estão prestando o serviço essencial de definir o que é verdade. Queremos garantir que a nossa infraestrutura apoie o seu trabalho, em vez de apenas consumi-lo.”

O acordo com a Wikimedia é um modelo. Abordagens semelhantes podem surgir em outras partes da indústria. À medida que os produtos de IA passam de demonstrações para produção em escala, as empresas que constroem a infraestrutura subjacente estão ajudando a moldar a forma como os sistemas de IA interagem com an internet.

O que isso significa se você estiver prestando atenção

Se você estiver construindo com IA, a conclusão prática é simples. O modelo não é mais o diferencial. Quase todas as pessoas têm acesso aos mesmos modelos de fronteira e as lacunas entre eles continuam a diminuir. O que separa um produto de IA que funciona em produção de outro que não funciona é cada vez mais a camada subjacente e se o sistema pode realmente alcançar as informações de que precisa para ser útil. Investir nessa camada pode oferecer benefícios significativos de engenharia.

Se você dirige uma empresa e nunca pensou em agentes de IA lendo seu web site, esse é o momento de começar. O canal de descoberta está mudando. Um cliente que anteriormente poderia ter encontrado uma empresa por meio de um mecanismo de pesquisa tradicional agora pode usar um assistente de IA como parte do processo de descoberta. Se esse assistente não conseguir ler o seu web site, talvez ele nem encontre você. Muitas empresas continuam a otimizar principalmente para leitores humanos e mecanismos de pesquisa enquanto avaliam como a descoberta orientada por IA pode afetar sua presença digital.

A Digital Developments faz parceria com colaboradores externos. Todo o conteúdo dos colaboradores é revisado pela equipe editorial do Digital Developments.

fonte

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui