Google Gemini agora cria IA personalizada e imagens mais realistas

barbara paiva

7 meses atrás

O Gemini receberá em breve dois novos recursos: o Gems e o novo modelo de geração de imagens Imagen 3, ambos apresentados durante a última edição do Google I/O em maio. O Gems é uma nova funcionalidade que permite criar “assistentes” de IA personalizados.

As Gems são “versões personalizadas de Gemini” que o usuário pode criar para diferentes fins, como um assistente de IA especialista em revisar códigos de programação, por exemplo. Segundo o Google, uma Gem pode “lembrar um conjunto detalhado de instruções para ajudar você a economizar tempo em tarefas tediosas, repetitivas ou difíceis”.

Funciona assim: primeiro o usuário insere instruções em texto do que procura e o Gemini cuida do resto. É possível especificar o tom, o comprimento máximo das frases para as respostas ou até mesmo solicitar emojis nas respostas. Após salva, cada nova Gem aparecerá no gerenciador de Gems, que fica no painel lateral do Gemini.

O Gemini Advanced terá alguns Gems integradas por padrão, são elas:

• Mentor de aprendizagem: que ajuda você a analisar tópicos complexos, tornando-os mais fáceis de entender.
• “Brainstormer”: que oferece inspiração e novas ideias “para uma festa temática até o presente perfeito para um aniversário que se aproxima”.
• Guia de carreira: com planos detalhados para refinar suas habilidades e atingir seus objetivos profissionais.
• Editor de redação: capaz de ajudar a aprimorar sua redação por meio de feedback claro e construtivo sobre gramática, estrutura de texto e mais.
• Parceiro de programação: que aprimora suas habilidades de programação e pode ajudá-lo a criar projetos e aprender à medida que avança.

As Gems serão lançadas nos próximos dias para assinantes do Gemini Advanced, Business e Enterprise em mais de 150 países — no Brasil, está disponível apenas em inglês.

Imagens mais realistas

Já o Imagen 3 é o modelo de geração de imagens mais recente do Google e está chegando ao Gemini com “disponibilidade para usuários em todos os idiomas” e nos próximos dias, os exemplos incluem:

Uma imagem de um vestido de baile feito de guardanapos de papel em um showroom elegante, uma imagem animada de um pequeno dragão saindo de um ovo e uma pintura abstrata vibrante com as palavras “Dream Big” espalhadas pela tela em cores fortes.

Usuários gratuitos poderão usar este modelo, mas a capacidade de gerar imagens de pessoas chegará primeiro ao Gemini Advanced, Business e Enterprise, começando em inglês. Após a remoção do recurso, o Google diz que “trabalhou para fazer melhorias técnicas no produto”.

“Nem toda imagem que o Gemini cria será perfeita, mas continuaremos a ouvir o feedback dos usuários do acesso antecipado do Gemini Advanced à medida que continuamos melhorando. Vamos lançar isso gradualmente, com o objetivo de levá-lo a mais usuários e idiomas em breve”, disse o Google, em comunicado.