Início Tecnologia Quanto custa (realmente) usar o Flash Claude Fable, GPT-5.5 e Gemini 3.5?

Quanto custa (realmente) usar o Flash Claude Fable, GPT-5.5 e Gemini 3.5?

25
0

Tem havido muitos murmúrios ansiosos ultimamente sobre o aumento do preço da IA. Os desenvolvedores estão gastando mais dinheiro treinando e executando sistemas de IA à medida que a concorrência aumenta e a rede elétrica fica comprimida. Os clientes, por sua vez, estão gastando mais para ter acesso aos modelos mais recentes.

No início desta semana, a Anthropic – avançando em direção ao que se espera ser um IPO histórico – divulgou Fábula 5uma versão reduzida do secreto e supostamente extremamente poderoso Mythos. Fable 5 custa o dobro do seu antecessor, Opus 4.8, embora alguns usuários tenham reclamado que o primeiro guarda-corpos de segurança delicados torná-lo efetivamente inutilizável em alguns contextos. Presumivelmente atento a essas ansiedades, a OpenAI está agora avaliando reduções significativas no preço que cobra pelos tokens (a unidade básica para medir o uso da IA), o Jornal de Wall Avenue relatado na quinta-feira.

Para qualquer pessoa que não esteja profundamente imersa nas complexidades das finanças da IA, tudo isso pode ser um pouco desconcertante. Seria extremamente conveniente se existisse algum método simples para converter um milhão de “tokens de entrada” para uma tarefa específica, por exemplo, mas infelizmente não é o caso. Cada tarefa traz suas próprias demandas computacionais, o que para modelos pré-pagos significa que os usuários terão que pagar valores diferentes dependendo de como usam a IA. Os níveis de assinatura oferecem um pouco mais de simplicidade, mas esses planos vêm com termos e preços próprios, que variam entre empresas e modelos.

Para esclarecer as coisas, aqui está o que você precisa saber sobre os modelos de precificação de três dos modelos mais poderosos da indústria de IA:

Fábula 5

Primeiro, o último lançamento da Anthropic, o lendário Fable 5.

Os assinantes dos planos Claude Max, Professional, Workforce e empresariais baseados em assentos podem usar o Fable 5 com os limites de tokens existentes em seu plano até 23 de junho. A partir dessa knowledge, a empresa planeja reverter para um modelo pré-pago para todos os usuários do Fable 5, o que significa que quanto mais intensamente eles usarem o modelo, mais os clientes terão que pagar—independentemente do nível de assinatura em que estejam inscritos.

A Anthropic pretende restabelecer as permissões usuais de tokens baseados em assinatura para Fable “quando a capacidade suficiente nos permitir fazê-lo”, de acordo com uma postagem de weblog publicada no início desta semana. Ainda não está claro o que acontecerá com os assinantes pagos do Claude que não esgotaram todo o seu limite de tokens antes da knowledge limite de 23 de junho; entramos em contato com a empresa para obter respostas e atualizaremos esta história assim que soubermos mais.

A principal coisa a lembrar aqui é que o Fable 5 consome mais tokens do que os modelos anteriores do Anthropic. Portanto, se você está pagando atualmente US$ 100/mês pelo plano Max 5x, continuará pagando o mesmo valor usando o Fable, mas há uma boa likelihood de atingir seu limite de tokens mais rapidamente.

A partir do dia 23, todos os usuários precisarão pagar US$ 10 por milhão de tokens de entrada e US$ 50 por milhão de tokens de saída ao usar o Fable.

De acordo com um atalho aritmético comum, um token é traduzido em aproximadamente quatro caracteres de texto; portanto, são necessários muitos avisos por escrito para chegar a um milhão de tokens, o que significa que você pode obter muito valor com US $ 10 se estiver usando o Fable apenas para, digamos, escrever e-mails de trabalho ou gerar receitas de jantar. Então, novamente, se isso é tudo para que você precisa de IA, você também pode usar um chatbot gratuito: usar o Fable para responder a bate-papos de texto simples é como dirigir um McLaren W1 para ir até a casa do vizinho.

O Fable 5 é especializado em tarefas autônomas de longa duração, como escrever código de software program, que requer muitos, muitos mais tokens – estamos falando de centenas de milhares a milhões para entradas e saídas. Sua fatura mensal será, portanto, significativamente maior do que seria se você apenas alimentasse o modelo com instruções de texto simples. Mas se você já está pagando, digamos, US$ 200/mês pelo plano Max 20x, talvez não esteja pagando muito mais pelos créditos de uso do que já paga: usar 10 milhões de tokens de entrada e 5 milhões de tokens de saída levaria a uma conta de US$ 350 ((US$ 10 x 10) + (US$ 50 x 5)).

O preço de usar o Fable 5, em outras palavras, dependerá inteiramente das demandas das tarefas para as quais você está usando o modelo – essa é, obviamente, a base do modelo pré-pago. Se você tende a entregar aos modelos tarefas complexas que exigem muitas etapas e longos períodos de tempo, proceda com cautela.

GPT-5.5 Pró

Lançado em abril, o GPT-5.5 Professional é o modelo mais recente do ChatGPT. Está disponível através do plano Professional da OpenAI (que custa US$ 200/mês) e também nos níveis Enterprise (US$ 30/usuário/mês) e Enterprise (preços personalizados) da empresa.

Os desenvolvedores que usam GPT-5.5 por meio da API OpenAI, por outro lado, são cobrados por um modelo pré-pago como aquele que começará a ser aplicado ao Fable no remaining deste mês. Custando US$ 5 por milhão de tokens de entrada e US$ 30 por milhão de tokens de saída, é significativamente mais barato que o Fable (e um pouco mais caro que o segundo modelo mais valioso disponível publicamente da Anthropic, Opus 4.8). Ele também vem com uma opção de tokenização em lote 50% mais barata, que essencialmente permite que os servidores da OpenAI lidem com pacotes de solicitações semelhantes em “lotes” únicos, aumentando a eficiência computacional, mas também resultando em tempos de resposta mais lentos.

Gêmeos 3.5 Flash

O Google destacou o que disse ser uma mistura única de velocidade e recursos de agência com a versão mais poderosa do Gemini, 3.5 Flash, lançada no mês passado.

Está disponível gratuitamente com limites de uso, e os desenvolvedores podem construir a API por US$ 1,50 por milhão de tokens de entrada e US$ 9 por milhão de tokens de saída – de longe a opção mais acessível dos três modelos que vimos até agora.

O resultado remaining

Assim como não existe um modelo de preços padronizado para IA em todo o setor, também há uma enorme variação nas vantagens e desvantagens de cada modelo.

Para muitos usuários que precisam apenas de um chatbot para servir como um mecanismo de busca glorificado, as versões gratuitas de Claude, ChatGPT ou Gemini provavelmente são adequadas. Qualquer pessoa cujo trabalho exija um modelo mais avançado para, digamos, fins de codificação ou pesquisa provavelmente está mais adequada para pagar por uma assinatura. Basta prestar atenção às letras miúdas antes de fazer uma escolha e ficar atento a frases-chave como “limites de uso” e “pague conforme usar”.

fonte

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui