Ícone do site Jornal O Sul

Nova inteligência artificial do Google consegue ouvir e criar vídeo a partir do texto

Google rebatizou sua inteligência Bard para Gemini. (Foto: Divulgação)

O Google anunciou uma série de novidades em inteligência artificial durante a sua conferência Google Cloud Next “24”, realizada em Las Vegas (EUA). Os destaques envolvem principalmente avanços ligados à IA generativa, quando algoritmos são capazes de gerar novos conteúdos, como texto, imagens, música, áudio e vídeos.

Entre os anúncios estão o novo Google Vids, aplicativo que usa inteligência artificial para criar vídeos, e expansão do sistema Imagen 2, que produz imagens a partir de palavras e frases escritas.

Ouvindo

A empresa anunciou novidades envolvendo sua plataforma de IA Gemini 1.5 Pro. Agora o robô de conversas do Google é capaz de “ouvir” arquivos em áudio. Ou seja, consegue processa sons e gerar informações sem a necessidade de comandos em texto. O recurso ainda em versão para desenvolvedores.

De acordo com o Google, sua plataforma consegue ainda processar grandes quantidades de informações em um único fluxo: isso inclui 1 hora de vídeo, 11 horas de áudio, bases de código com mais de 30.000 linhas ou mais de 700.000 palavras.

Frases em vídeo

No Google Workspace (central de programas como Gmail, Drive, Meet), o Google Vids é uma novidade. Trata-se de um assistente de criação de vídeos com IA que interpreta dicas de escrita, produção e edição. Isso possibilitará, por exemplo, a geração de um storyboard e a composição de um primeiro rascunho com cenas sugeridas a partir de vídeos, imagens e música de fundo.

A ser lançada em junho, a ferramenta tem a finalidade de fazer vídeos de propostas de produtos, conteúdo de treinamento ou conteúdos comemorativos de equipe. Para o storyboard, a IA pode usar arquivos no Google Drive do usuário ou imagens de estoque fornecido pela própria empresa. Após isso, a edição dos usuários é livre.

IA para GIFs

Para o Imagen 2, tecnologia que transforma texto em imagens, foi anunciado um novo recurso capaz de permitir que equipes de marketing e criação gerem imagens animadas (como gifs) equipadas com filtros de segurança e marcas d’água digitais.

Anotações

Dentro de Google Chat e Google Meet, um assistente com tecnologia de IA poderá resumir conversas e responder perguntas (versão de testes ainda).

No Meet, ainda haverá funções como “Faça anotações para mim” (em preview) ou “Traduzir para mim”. As novidades chegarão em junho ao sistema, e serão capazes de detectar e traduzir automaticamente informações em 69 idiomas, incluindo português e espanhol.

Sair da versão mobile