Início Tecnologia Anthropic estreia Claude Opus 4.8, provoca o próximo lançamento de ‘modelos da...

Anthropic estreia Claude Opus 4.8, provoca o próximo lançamento de ‘modelos da classe Mythos’

31
0

Na quinta-feira, a Anthropic lançou o Claude Opus 4.8, a versão mais recente e avançada de seu principal modelo de IA. Está disponível em qualquer lugar pelo mesmo preço de seu antecessor, Opus 4.7 (US$ 5 por milhão de tokens de entrada e US$ 25 por milhão de tokens de saída).

O Opus 4.8 ostenta pontuações líderes do setor em tarefas como codificação de agentes e uso de computadores de agentes, o que é regular para um novo modelo antrópico. O principal diferencial destacado pela empresa é a “honestidade” do modelo – e, por extensão, sua confiabilidade geral.

De acordo com uma empresa postagem no blogOpus 4.8 é especializado em detectar seus próprios erros e sinalizá-los aos usuários: “um problema geral com os modelos de IA é que eles às vezes tiram conclusões precipitadas, alegando com segurança que fizeram progresso em seu trabalho, apesar das evidências serem escassas”, escreveu a empresa. “Os primeiros testadores relatam que o Opus 4.8 tem maior probabilidade de sinalizar incertezas sobre seu trabalho e menos probabilidade de fazer afirmações não comprovadas.”

Por exemplo, Michael Ran, associado sênior de investimentos da empresa de gestão de ativos Bridgewater, foi citado na postagem do weblog da Anthropic dizendo que o Opus 4.8 foi capaz de “sinalizar proativamente problemas com as entradas e saídas de uma análise, algo que outros modelos rotineiramente ignoravam e deixavam para os usuários capturarem”.

O Opus 4.8 também apresenta um risco “substancialmente menor” de comportamentos desalinhados e perigosos, incluindo a geração de conteúdo sexual prejudicial e “minar a democracia liberal”, de acordo com o modelo. placa de sistema.

Fluxos de trabalho dinâmicos e controle de esforço

Além do novo modelo, a Anthropic também anunciou o lançamento de “fluxos de trabalho dinâmicos”, um novo recurso agora disponível como uma prévia da pesquisa, que permite a Claude lidar com tarefas de codificação mais complexas, implantando centenas de subagentes que podem trabalhar em paralelo entre si.

Os usuários podem esperar uma melhoria notável do Opus 4.8, especialmente para tarefas maiores de codificação, mas isso não muda o jogo. A Anthropic até tentou limitar as expectativas, escrevendo em sua nova postagem no weblog que o Opus 4.8 é “uma melhoria modesta, mas tangível em relação ao seu antecessor”, o Opus 4.7. Esse modelo estreou há pouco mais de um mês e recebeu uma resposta morna dos usuários, alguns dos quais reclamaram que seu recurso de “pensamento adaptativo” às vezes fazia com que ele gastasse muito tempo em tarefas que deveriam ser rápidas e fáceis, e não tempo suficiente em tarefas que merecem mais esforço.

Talvez em resposta direta a essa reclamação, a Anthropic também anunciou na quinta-feira o lançamento de um novo painel de “controle de esforço” (encontrado no menu suspenso do seletor de modelo) para Claude, que permite escolher manualmente a quantidade de esforço – e tokens – que você deseja gastar em uma determinada tarefa. Está definido como “Baixo” por padrão e você pode alterná-lo para “Médio”, “Alto” ​​e “Máx” ou ativar o modo de pensamento adaptativo.

“Modelos da classe Mythos”

A Anthropic também provocou a estreia de “uma nova classe de modelo” com capacidades que supostamente estão no mesmo nível das de Mitoso modelo misterioso que está causando arrepios na espinha do Vale do Silício. A empresa ainda não divulgou o modelo publicamente, citando o poder sem precedentes do modelo e os seus riscos de segurança cibernética.

De acordo com sua nova postagem no weblog, a Anthropic está atualmente trabalhando em testes de salvaguardas para Mythos e espera lançar “modelos da classe Mythos para todos os nossos clientes nas próximas semanas”.

Obviamente, isso é extremamente vago, provavelmente intencionalmente. O tempo dirá se esses novos modelos estão à altura dos primeiros rumores destruidores de paradigmas que têm circulado em torno de Mythos, ou se (mais provavelmente do que não) a nova categoria de modelos é uma versão substancialmente diluída do gigante unique. Afinal, os desenvolvedores de IA tendem a exagerar nas habilidades e perigos de seus próprios modelos antes de serem lançados e, na maioria dos casos, a realidade não atende às expectativas. (Lembra-se de toda a empolgação sobre o GPT-5 ser AGI?) Então, novamente, talvez a Anthropic esteja realmente pronta para lançar modelos devastadores que foram considerados uma ameaça existencial à segurança world apenas alguns meses atrás. O tempo dirá e apresentaremos um relatório assim que soubermos mais.

fonte

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui