Início Tecnologia Os novos modelos de IA da Apple não contêm ‘nenhum’ do Gemini...

Os novos modelos de IA da Apple não contêm ‘nenhum’ do Gemini Assistant do Google

32
0

Os executivos da Apple detalharam a arquitetura dos novos Apple Basis Fashions (AFM) da empresa e esclareceram exatamente como a tecnologia do Google foi levada em consideração em seu desenvolvimento.


Craig Federighi, vice-presidente sênior de engenharia de software program da Apple, realizou uma palestra técnica pós-apresentação (by way of 9to5Mac) com a imprensa na segunda-feira ao lado do vice-presidente de IA, Amar Subramanya, do líder da Siri, Mike Rockwell, e do vice-presidente de software program, Sebastien Marineau-Mes, para explicar como a família AFM de terceira geração foi construída e como ela alimenta a Apple Intelligence.

“A quantidade de Google Assistant que usamos é nenhuma”, disse Federighi, explicando que a Apple não usa nenhum dos modelos Gemini implantados para os clientes do Google, nenhum código do lado do cliente do Google e nenhuma infraestrutura de pesquisa do Google como base de conhecimento.

Claro, não temos o aplicativo Gemini como nosso aplicativo. Na verdade, nenhum desses códigos de cliente faz parte de como rodamos no iOS. Para esses modelos, não usamos nenhum dos modelos que o Google implanta para seus clientes, nem usamos a infraestrutura e os meios pelos quais eles implantam modelos para seus clientes. E então, quando se trata da base de conhecimento, é claro que não usamos a Pesquisa Google ou algo parecido como base do nosso sistema.

Subramanya descreveu a nova família AFM, que abrange dois modelos no dispositivo e três modelos no lado do servidor. A camada no dispositivo consiste no AFM Core, um modelo de arquitetura densa de próxima geração, e no AFM Core Superior, que usa uma arquitetura esparsa e é nativamente multimodal.

Subramanya disse que o AFM Core Superior é “diferente de qualquer modelo de dispositivo que já executamos”, permitindo novos recursos, incluindo convites e vozes expressivas, sem quaisquer solicitações de nuvem. No lado do servidor, o AFM Cloud lida com solicitações de computação em nuvem privada com latência otimizada, enquanto o AFM Cloud Picture potencializa recursos de geração e edição de imagens, incluindo reenquadramento espacial.

O detalhe principal da colaboração do Google veio na descrição de Subramanya de como esses quatro modelos foram treinados. “Todos eles são personalizados para Apple Silicon, treinados usando dados proprietários com aprendizado de reforço e refinados usando resultados de modelos de fronteira Gemini”, disse ele, deixando claro que a contribuição do Google foi baseada na destilação, não na adoção em massa do Gemini.

O quinto e mais capaz modelo, AFM Cloud Professional, foi projetado para uso de ferramentas de agente e tarefas de raciocínio complexas, com qualidade que Subramanya disse ser “semelhante aos modelos de fronteira Gemini”. Este modelo marca um afastamento da configuração padrão de computação em nuvem privada da Apple.

Para executá-lo, a Apple trabalhou com o Google e a Nvidia para estender sua infraestrutura de nuvem privada às GPUs Nvidia hospedadas na nuvem do Google. Marineau-Mes disse que a Apple queria usar os chips mais recentes da Nvidia, mas exigia que eles fossem configurados para que não pudessem ler o conteúdo dos servidores da Apple. Uma tecnologia recente da Nvidia chamada “computação confidencial ambígua” forneceu a solução.

Queríamos aproveitar a tecnologia mais recente da Nvidia e, por isso, decidimos estender a computação em nuvem privada para nuvens de terceiros.

Federighi descreveu a arquitetura mais ampla do sistema como sendo organizada em torno de um System Orchestrator, um software program que ele chamou de “chave para a arquitetura de privacidade de todo o nosso sistema”. O orquestrador encaminha qualquer consulta para o modelo apropriado, no dispositivo ou na nuvem, com base na complexidade da solicitação e no contexto pessoal necessário.

Ele se baseia em uma caixa de ferramentas de aplicativo para ações no aplicativo, um índice semântico Highlight para conteúdo pessoal e contexto na tela para reconhecimento em tempo actual. Para perguntas envolvendo eventos atuais, as respostas são encontradas através do próprio World Information Service da Apple, que Federighi disse que a empresa vem construindo há vários anos.

A Apple também afirma que toda a infraestrutura de computação em nuvem privada, incluindo a capacidade estendida da GPU Nvidia na nuvem do Google, pode ser verificada de forma independente por pesquisadores terceirizados para confirmar que os dados do usuário nunca são armazenados ou acessados.

fonte

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui