Início Tecnologia O menor modelo da Liquid AI até agora, LFM2.5-230M, supera os modelos...

O menor modelo da Liquid AI até agora, LFM2.5-230M, supera os modelos 4X seu tamanho na extração de dados, pode ser executado em ‘qualquer lugar’

24
0

A Liquid AI, fundada por ex-cientistas da computação do MIT, lançou hoje seu menor modelo de linguagem de IA até agora, LFM2.5-230Me as empresas fariam bem em considerá-lo para uso na extração de dados e implantação native em smartphones, laptops e robótica.

Este é um modelo básico de 230 milhões de parâmetros projetado explicitamente para fluxos de trabalho de agentes no dispositivo e, como Liquid afirma em sua postagem no weblog de lançamento, esse tamanho pequeno torna possível a execução em quase “qualquer lugar”. De acordo com a Liquid, ele também supera os modelos em mais de 4 vezes seu tamanho em benchmarks selecionados, especificamente se saindo melhor na extração de dados do que a contagem de 800 milhões de parâmetros Alibaba Qwen3.5-0.8B (Instruct) e o parâmetro de 1 bilhão do Google Gemma 3 1B.

Gráfico de comparação de benchmark Liquid AI LFM2.5-230M. Crédito: IA líquida

O modelo tem como alvo desenvolvedores e engenheiros que criam pipelines leves de extração de dados e sistemas de borda autônomos.

Operando sob uma licença comercial de dupla utilização, o modelo permanece gratuito para indivíduos e empresas que geram menos de 10 milhões de dólares em receitas anuais, ao mesmo tempo que exige um acordo empresarial pago para grandes corporações.

Esta versão se diferencia de outros pequenos modelos de IA ao utilizar a arquitetura LFM2 para atingir altas velocidades de inferência sem a enorme sobrecarga de memória típica de transformadores com muitos parâmetros.

Enquanto as principais empresas de IA Anthropic, OpenAI, Google, Microsoft, Meta e outras aumentam a contagem de parâmetros para centenas de bilhões ou trilhões para alcançar desempenho de fronteira, uma corrida paralela se concentra inteiramente na borda e nas implantações locais.

O lançamento do LFM2.5-230M pela Liquid AI sinaliza uma mudança basic em direção à eficiência arquitetônica em relação ao dimensionamento de força bruta. Ao comprimir 19 trilhões de tokens de pré-treinamento em uma área de 230 milhões de parâmetros, a empresa demonstra que os dispositivos de borda não precisam de enorme poder computacional ou conexões persistentes na nuvem para executar fluxos de trabalho de agente complexos e de várias etapas.

Como funciona o LFM2.5-230M

O modelo LFM2.5-230M diverge das arquiteturas de transformadores padrão, contando, em vez disso, com a estrutura LFM2. Essa arquitetura funciona como um sistema híbrido, intercalando convoluções fechadas de curto alcance com atenção de consulta agrupada para processar informações de forma eficiente.

Para aqueles que acompanham a evolução de arquiteturas eficientes, a abordagem da Liquid compartilha um objetivo conceitual semelhante: gerenciar contextos longos e dados sequenciais de forma eficaz em {hardware} de ponta, sem os custos quadráticos de memória de mecanismos de atenção pura. O modelo suporta uma janela de contexto expansiva de 32K, permitindo a ingestão de documentos substanciais ou fluxos contínuos de telemetria robótica.

Ao analisar os gráficos de desempenho fornecidos no comunicado, a eficiência arquitetônica torna-se visualmente aparente. O modelo mantém um consumo de memória inferior a 400 MB enquanto atinge velocidades de pré-preenchimento e decodificação que superam modelos comparáveis ​​como Gemma 3 1B IT e Granite 4.0-H-350M.

Em um Samsung Galaxy S25 Extremely equipado com CPU Qualcomm Snapdragon Gen4, o modelo atinge uma velocidade de decodificação de 213 tokens por segundo. Mesmo em um Raspberry Pi 5 altamente restrito, o modelo mantém uma taxa de decodificação de 42 tokens por segundo. Além disso, o benchmarking interno mostra que a pilha de inferência da GPU oferece menor latência ponta a ponta do que os pequenos modelos concorrentes em todos os níveis de simultaneidade.

Por que é importante para as empresas

Para compreender por que é necessário um modelo de 230 milhões de parâmetros, é necessário observar como as empresas gerem atualmente os dados.

As organizações tradicionalmente contam com scripts rígidos e baseados em regras de extração, transformação e carregamento (ETL) para mover e processar dados. Contudo, estes sistemas legados são notoriamente frágeis; uma simples mudança no structure de um documento ou uma atualização de esquema pode quebrar todo o pipeline.

Para resolver isso, a indústria está migrando para o “AI ETL”, onde o aprendizado de máquina infere mapeamentos, detecta desvios de esquema e se adapta às mudanças automaticamente. Em um pipeline moderno e leve de extração de dados, um modelo de IA se conecta a fontes não estruturadas, como PDFs, e-mails ou formulários da net, e estrutura os dados em formatos como JSON, sem exigir regras codificadas.

Para as empresas, usar um modelo carro-chefe massivo como Claude Opus 4.6 (que custa US$ 5,00 por milhão de tokens de entrada) para analisar faturas de rotina, formatar endereços ou encaminhar dados de telemetria é economicamente inviável.

É aqui que modelos como o LFM2.5-230M se tornam críticos. Projetado explicitamente como um mecanismo de extração leve, ele permite que as empresas automatizem a formatação repetitiva e a análise de dados por uma fração do custo e da latência de computação, executando diretamente no {hardware} native, em vez de depender de chamadas de API contínuas e caras na nuvem.

Benchmarks de modelos pequenos: LFM vs. classe 3B

A indústria de IA em meados de 2026 está vendo um renascimento em modelos “pequenos”, mas a definição de “pequeno” varia muito.

Recentemente, a comunidade de peso aberto ficou surpresa com o VibeThinker-3B do Weibo, um modelo de 3 bilhões de parâmetros construído em um spine estilo Qwen2 que alcançou impressionantes 94,3 no benchmark matemático AIME 2026, rivalizando com gigantes de 600 bilhões de parâmetros por meio de curadoria agressiva de dados e aprendizado por reforço.

Da mesma forma, a família Gemma 4 do Google – que recentemente ultrapassou 200 milhões de downloads – leva a IA de ponta ao limite, incluindo o E2B (2 bilhões de parâmetros) projetado especificamente para implantações móveis e IoT.

Por outro lado, o LFM2.5-230M da Liquid AI opera em uma classe de peso completamente diferente. Com apenas 230 milhões de parâmetros, é aproximadamente um décimo do tamanho do menor modelo Gemma 4 do Google e do VibeThinker-3B.

Devido à sua pegada microscópica, o LFM2.5-230M não foi projetado para competir em cargas de trabalho pesadas de raciocínio, como matemática avançada, codificação ou escrita criativa – uma restrição que a Liquid AI reconhece explicitamente.

No entanto, nos domínios pretendidos de extração de dados e chamada de ferramentas, o modelo está bem acima de sua classe de peso.

Os benchmarks divulgados pela Liquid AI mostram LFM2.5-230M pontuando 43,26 no benchmark de uso de ferramentas BFCLv3, dominando o Granite 4.0-350M da IBM (39,58) e superando completamente modelos maiores de 1 bilhão de parâmetros, como o Gemma 3 1B IT do Google (16,61).

Gráfico de barras de comparação de benchmark Liquid AI LFM2.5-230M

Gráfico de barras de comparação de benchmark Liquid AI LFM2.5-230M. Crédito: IA líquida

No CaseReportBench para extração de dados, obteve pontuação 22,51, dizimando o Qwen3.5-0.8B (Instruir).

LFM2.5-230M prova que, embora modelos de 3 bilhões de parâmetros como o VibeThinker estejam resolvendo cálculo avançado, um modelo de 230 milhões de parâmetros é a escolha superior e altamente otimizada para executar chamadas de ferramentas estruturadas e manter pipelines de agente funcionando com eficiência em {hardware} restrito.

Usos de pesquisa avançada

Por ser excelente na chamada de ferramentas, o LFM2.5-230M funciona principalmente como uma camada de seleção de habilidades. A Liquid AI demonstrou essa capacidade implantando o modelo em um robô humanóide Unitree G1.

Executando inteiramente no dispositivo por meio do módulo de computação NVIDIA Jetson Orin integrado do robô, o modelo processa com sucesso comandos ambientais complexos.

Conforme observado no weblog técnico da empresa, o modelo segue uma instrução de formato livre como, * “Fique parado por 2 segundos, depois caminhe para frente a 1 metro por segundo por 3 metros, mantenha um joelho para frente com uma perna por 5 segundos e ande para trás a 0,5 metros por segundo por 3 metros”, * e o traduz automaticamente em um plano estruturado de várias etapas, recorrendo a habilidades pré-treinadas de baixo nível fornecidas pela estrutura SONIC da NVIDIA.

Os modelos básicos e pós-treinados estão disponíveis imediatamente no Hugging Face, com suporte nativo no primeiro dia em todo o ecossistema de inferência para llama.cpp (GGUF), MLX, vLLM, SGLang e ONNX.

Licença aberta LFM personalizada e de uso duplo

Liquid AI envia LFM2.5-230M sob a licença aberta LFM v1.0. Apesar da palavra “aberta” no título, esta não é uma licença compatível com Open Supply Initiative (OSI); funciona como uma estrutura comercial restrita e de dupla utilização.

Para desenvolvedores independentes, pesquisadores e startups em estágio inicial, a licença funciona de forma idêntica ao software program de código aberto.

Os usuários recebem uma licença perpétua, mundial e isenta de royalties para reproduzir, modificar e distribuir o modelo, desde que mantenham os avisos de direitos autorais originais e indiquem de forma destacada quaisquer modificações.

No entanto, a licença inclui uma “Limitação de Uso Comercial” estrita. Qualquer entidade authorized que gere US$ 10 milhões ou mais em receita anual perde o direito de usar o modelo comercialmente sob este acordo.

As grandes empresas que ultrapassam este limite financeiro devem negociar um acordo comercial pago separado com a Liquid AI para implantar o modelo em produção.

Esta estratégia protege a empresa de ter a sua propriedade intelectual absorvida gratuitamente por grandes conglomerados tecnológicos, ao mesmo tempo que continua a semear o modelo ao nível do desenvolvedor de base.

fonte

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui