A Apple supostamente planeja usar a Worldwide Builders Convention (WWDC) do próximo mês para destacar seus recursos de IA no dispositivo como uma vantagem competitiva, apoiando-se em 15 anos de experiência em silício personalizado para defender a execução de modelos de IA localmente, em vez de na nuvem.
Pessoas familiarizadas com os planos da Apple conversando com A informação dizem que espera-se que a empresa mostre como os chips projetados para iPhones, Apple Watches e Macs proporcionam uma vantagem no processamento de consultas de IA diretamente nos dispositivos. Embora o processamento baseado em nuvem proceed sendo necessário para consultas complexas, a Apple posicionará a inferência native como uma alternativa que preserva a privacidade e economiza custos às enormes construções de knowledge facilities que seus rivais têm buscado.
Como parte de seu acordo com o Google, a Apple aparentemente pretende usar uma versão grande do modelo Gemini do Google para treinar uma versão menor e destilada, capaz de rodar localmente no {hardware} da Apple. Diz-se também que a Apple está buscando aquisições para ajudar a avançar em seu trabalho de redução de modelos, com uma empresa que supostamente considerou ser a Liquid AI, uma startup de Massachusetts focada em executar IA localmente em dispositivos.
Algumas consultas ainda exigirão processamento na nuvem. Acredita-se que a Apple tenha aprovado o uso da tecnologia de computação confidencial da Nvidia dentro do Google Cloud para lidar com o processamento do modelo maior baseado no Gemini. O recurso de segurança criptografa dados e modelos de IA durante o processamento, adicionando um custo modesto de desempenho, mas oferecendo proteções de privacidade mais fortes.
O acordo representa um afastamento notável do anúncio unique da Apple Intelligence da Apple, no qual a empresa disse que todas as consultas vinculadas à nuvem seriam tratadas exclusivamente por sua própria infraestrutura de computação em nuvem privada rodando em silício da Apple. A Apple provavelmente manterá a marca Non-public Cloud Compute, apesar da mudança, disseram pessoas familiarizadas com a parceria A informação.
Diz-se também que há limites materiais para o quão longe a Apple pode levar o processamento no dispositivo. O modelo Gemini completo do Google atende a trilhões de parâmetros e A informação afirma que a Apple tem lutado para executá-lo em sua própria infraestrutura de computação em nuvem privada, que usa os mesmos chips de silício da Apple encontrados em computadores Mac.
O Apple Intelligence foi anunciado pela primeira vez na WWDC 2024, mas o lançamento foi prejudicado por uma resposta morna aos recursos iniciais e um atraso prolongado na versão mais pessoal do Siri. Espera-se agora que a Apple use o WWDC 2026, que acontece a partir de 8 de junho, para reformular a narrativa, reintroduzir os recursos atrasados e estrear novos.










