Início Tecnologia Acontece que ensinar jogos como Battleship pode tornar pequenos modelos de IA...

Acontece que ensinar jogos como Battleship pode tornar pequenos modelos de IA muito mais inteligentes

19
0

Pequenos modelos de IA receberam um impulso surpreendente de um jogo muito antigo.

Pesquisadores do MIT usou uma configuração no estilo Battleship para testar se os agentes de IA podem melhorar a forma como coletam informações antes de fazer um movimento. O resultado foi um salto acentuado no desempenho de sistemas menores, incluindo um modelo que passou de raramente vencer os humanos para vencer a maioria de seus jogos depois que os pesquisadores mudaram a forma como ele vasculhava o tabuleiro.

Essa mudança atinge diretamente uma das maiores fraquezas dos agentes de IA atuais. Freqüentemente, eles são solicitados a realizar tarefas em que a resposta depende de detalhes que ainda não possuem. O trabalho do MIT sugere que um melhor planejamento de perguntas pode fazer com que um modelo mais barato atue de forma muito mais capaz.

Quão mais inteligente ficou

O teste do MIT usou uma versão do Battleship construída em torno de questões de linguagem pure. Um agente de IA desempenhou o papel de companheiro de equipe tentando localizar naves escondidas, enquanto outro teve acesso ao tabuleiro e respondeu.

O maior salto veio do Llama 4 Scout. O MIT disse que o modelo menor venceu os jogadores humanos em apenas 8% dos jogos no início. Depois que os pesquisadores adicionaram uma estratégia de inferência mais deliberada, ela superou os humanos em 82% das vezes e ultrapassou um modelo de fronteira maior, operando com cerca de 1% do custo.

Esse é o número a ser observado se você se preocupa com os custos de IA. O modelo não venceu por ficar maior, mas por escolher perguntas mais precisas e fazer melhor uso de cada resposta.

Por que o Battleship ajuda a IA a aprender

Battleship funciona como um teste porque força um agente de IA a agir com informações limitadas. Ele não pode ver o tabuleiro inteiro, então cada pergunta precisa restringir a pesquisa e definir o próximo movimento.

Isso mapeia perfeitamente as ferramentas práticas de IA. Um bot de suporte, assistente de pesquisa ou agente de planejamento geralmente precisa solicitar acompanhamento antes de poder ajudar. Quando esse processo falha, o modelo pode perder um detalhe importante, repetir-se ou fazer uma recomendação demasiado cedo.

A abordagem do MIT pressiona esse ponto fraco. Mede se um agente consegue reunir as informações corretas antes de produzir uma resposta.

Onde isso poderia ir a seguir

O teste mais difícil é se a mesma abordagem funciona além dos jogos. O Battleship é controlado, o que torna mais fácil a pontuação do que fluxos de trabalho abertos de agentes em pesquisa, suporte ao cliente ou software program de native de trabalho.

Ainda assim, vale a pena assistir a direção. Se os modelos mais pequenos aprendessem a fazer perguntas mais precisas antes de agir, as empresas poderiam construir ferramentas de IA mais baratas e mais capazes no uso diário.

O próximo marco é a transferência do tabuleiro de jogo para o trabalho actual. Uma tarefa com instruções pouco claras, arquivos ausentes e um usuário apressado será muito mais difícil de resolver.

fonte

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui