Siga ZDNET: Adicione-nos como fonte preferencial no Google.
Principais conclusões da ZDNET
- O Google Omni pretende fazer pelo vídeo o que o Nano Banana fez pelas imagens.
- Os criadores podem criar vídeos a partir de texto, imagens, áudio ou vídeo.
- Os avatares de IA podem ajudar os criadores, mas levantam questões de confiança.
Na semana passada, o Google anunciou um novo recurso de vídeo de IA que ajudará os criativos a produzir vídeos de alta qualidade com mais facilidade ou aumentará enormemente a quantidade de desperdício de IA no YouTube. Aposto que será uma mistura de ambos.
Google anunciou Gêmeos Omniuma ferramenta que eleva a capacidade de criar vídeo by way of IA a um nível totalmente novo. A empresa comparou este anúncio ao nível de melhoria na geração de imagens de IA alcançado quando lançou o Nano Banana.
Também: Google I/O 2026: tudo anunciado
Nano Banana elevou consideravelmente o nível do que period possível com a geração de imagens. Omni pretende fazer o mesmo com o vídeo. Omni começou a ser lançado, mas ainda não tive oportunidade de brincar com ele.
O Google descreveu Omni como “onde a capacidade de raciocinar de Gêmeos encontra a capacidade de criar”. Curiosamente, segundo a empresa, “com o Omni, você pode combinar imagens, áudio, vídeo e texto como entrada e gerar vídeos de alta qualidade baseados no conhecimento do mundo actual da Gemini”.
Embora Omni esteja “começando com vídeo”, o Google disse que o novo modelo pode “criar qualquer coisa a partir de qualquer entrada”, então provavelmente veremos outros tipos de mídia gerados pela ferramenta no devido tempo.
Além disso: 6 aplicativos Android Auto que gostaria de ter encontrado antes, porque eles tornam cada viagem mais fácil
Omni também estará disponível em níveis de modelos, começando agora com Gemini Omni Flash. O recurso está chegando ao aplicativo Gemini, Google Stream e YouTube Shorts. Não está claro se a versão internet do Gemini suportará Omni ou se você precisará usar a interface Stream por meio de seu navegador.
Existem alguns recursos de destaque que tornam esta oferta muito interessante.
Clonar você mesmo
Sinceramente, não consigo decidir se este será um recurso de destaque, uma grande preocupação com a privacidade ou um gerador de resíduos sem restrições. A empresa disse que você pode criar vídeos “com sua própria voz usando Avatares, que criam uma versão digital de você mesmo para que você possa gerar vídeos que se pareçam e soem com você”.
Além disso: usei Nano Banana 2 para fazer esboços perfeitos: 5 lições aprendidas
Como produtor common de vídeos do YouTube para meu canal, estou intrigado. Houve momentos em que eu queria lançar um vídeo, mas estava tendo um dia de cabelo ruim, um dia de voz ruim ou um dia de atitude ruim, e eu simplesmente não queria que isso aparecesse no vídeo.
Posso simplesmente inserir um script em meu avatar gêmeo digital e deixar RoboDave falar? Meu público notaria? Eles se importariam? Eles odiariam isso? Eu iria? É claro que essa é uma área digna de experimentação, mas provavelmente não é algo que usarei com frequência.
Eu crio meu canal no YouTube, em parte, para manter minhas palestras e apresentações em alta. Impingir esse trabalho em um avatar digital poderia reduzir minha carga de trabalho, mas também reduziria meu treinamento e prática.
O Google tem muito cuidado ao dizer que está incorporando sua tecnologia de impressão digital SynthID nesses vídeos, para que possam ser verificados como tendo sido produzidos com Omni. O Google também disse: “Além do recurso de avatar, em termos de edição de vídeos para alterar áudio e fala, ainda estamos trabalhando para testar isso e entender melhor como podemos levar esse recurso aos usuários de forma responsável”.
Modelo de física
Alguns de vocês devem se lembrar dos primórdios dos videogames, quando os personagens se comportavam mais como bonecos de pano do que como objetos no mundo físico. À medida que os jogos foram melhorando, eles começaram a incorporar modelos físicos; portanto, se algo fosse atingido, derrubado ou derrubado, isso acontecia de maneira consistente com a física do objeto.
Omni agora incorpora física nos vídeos que cria. O Google disse que tem “uma compreensão intuitiva melhorada de forças como gravidade, energia cinética e dinâmica de fluidos”. Ele também usa o conhecimento de Gêmeos para “conectar linguagem, imagens e significado de maneiras que vão muito além da correspondência de padrões”.
Além disso: as novas marcas d’água de imagem da OpenAI facilitam a identificação de falsificações de IA – veja como
A empresa disse que a Omni pode criar vídeos detalhados a partir de instruções curtas e gerar vídeos para coisas como explicadores que detalham ideias bastante complexas. Eu não duvido disso. Os recursos de análise da visão geral de áudio e da visão geral de vídeo do NotebookLM para poder criar explicadores são surpreendentes. Se alguma dessa tecnologia chegasse ao Omni, as coisas poderiam ficar interessantes rapidamente.
Na verdade, coloquei documentos de advertising e folhas de especificações no NotebookLM e ele produziu vídeos explicativos para vários recursos do meu produto de segurança que eram melhores do que qualquer coisa que eu pudesse ter feito manualmente, especialmente no tempo que levou. O visible na época não period ótimo, mas ter recursos complexos explicados em um vídeo limpo em menos de 30 minutos foi um multiplicador de força para meu cronograma de lançamento de produto.
Variedade de entrada
Um dos primeiros recursos de destaque do Nano Banana foi a capacidade de recontextualizar uma imagem. Por exemplo, pedi para ele tirar uma foto minha andando em um parque e mudá-la para que eu usasse algo parecido com um uniforme de almirante na ponte de um porta-aviões. Embora não tenha acertado na salada de frutas e no latão uniforme, conseguiu reproduzir com precisão meu corpo e rosto.
Além disso: transformei selfies casuais em fotos profissionais com Gêmeos
Omni propõe levar isso para vídeo, transformando imagem, texto, vídeo ou áudio em uma “saída coesa”. No momento, o único áudio que aceitará serão gravações de voz, mas a empresa disse que “lançará outros tipos de entradas de áudio em breve”.
A empresa também disse que você pode criar cenas, combinar estilos, descrever o que deseja em linguagem pure e obter consistência de personagens ao longo do vídeo.
Edição conversacional
Um aspecto da produção de vídeos que não gosto é o processo de edição. Muitas vezes é extremamente tedioso. Mas, com Omni, “Gemini Omni oferece uma maneira mais fácil de editar vídeo – com linguagem pure. Cada instrução se baseia na anterior. Seus personagens permanecem consistentes, a física se mantém e a cena lembra o que veio antes.”
O Google também disse que você pode alterar elementos do vídeo. Vejo um grande benefício se for possível importar um vídeo e fazer com que o editor remova obstruções ou altere objetos e planos de fundo. Não está claro quanto tempo um clipe pode durar ou exatamente quanta edição você pode fazer com o Omni em um determinado plano, mas essas possibilidades são empolgantes.
Além disso: o Sora 2 e outras ferramentas de vídeo de IA são arriscados de usar? Aqui está o que diz um estudioso do direito
Duas outras transformações que a empresa disse que o novo Omni pode fazer são:
- Mude coisas específicas ou mude tudo. Seu vídeo se torna o ponto de partida para algo que você nunca poderia ter filmado.
- Faça um vídeo que você gravou e peça ao Omni para mudar o que está acontecendo. Edite a ação, adicione novos personagens ou objetos ou transforme um momento em algo inesperado.
Além disso, o Google ainda não especificou o formato ou resolução do vídeo. Será uma ferramenta profissional capaz de lidar com vídeos 16:9 em resolução 4K ou 8K ou será uma ferramenta para a geração de Shorts do YouTube?
Quando a OpenAI introduziu o Sora, period uma novidade. Embora os usuários tenham abusado dele (demos cabelo azul a Sam Altman e o fizemos elogiar o ZDNET), ele nunca conseguiu ser uma ferramenta que ajudasse no fluxo de trabalho de um profissional.
Embora produzir clones de avatares de IA e substituir objetos possa ser divertido, espero que esse recurso seja estendido para que possa ser usado dentro do Last Reduce, Premiere Professional e DaVinci Resolve, ou pelo menos integrado o suficiente para que essas ferramentas possam usar edições criadas pelo Omni.
É possível. Os recursos do Omni serão lançados para clientes corporativos e desenvolvedores por meio de uma API do Google.
Além disso: as novas marcas d’água de imagem da OpenAI facilitam a identificação de falsificações de IA – veja como
Também estou curioso para saber se a Omni irá incorporar a pequena marca d’água de diamante no canto de seus vídeos, como faz com as imagens geradas pelo Nano Banana. Embora seja bom saber que um clipe foi gerado pela IA, essa marca d’água atrapalha o uso da IA como ferramenta profissional.
Veremos níveis de licenciamento onde a marca d’água poderá ser removida? Ou veremos surgir ferramentas de terceiros que removem a marca d’água, quer o Google queira ou não? O tempo dirá.
Você usaria o Google Omni para criar um avatar digital seu para vídeos que não deseja gravar pessoalmente? Deixe-nos saber nos comentários abaixo.
Você pode acompanhar as atualizações diárias do meu projeto nas redes sociais. Certifique-se de se inscrever meu boletim informativo semanal de atualizaçãoe siga-me no Twitter/X em @DavidGewirtzno Fb em Facebook.com/DavidGewirtzno Instagram em Instagram.com/DavidGewirtzno Bluesky em @DavidGewirtz.come no YouTube em YouTube.com/DavidGewirtzTV.












