Com o lançamento do Gemini em um post assinado por nada menos que Sundar Pichai (CEO do Google) e o gênio Demis Hassabis, a empresa de Mountain View mostra que finalmente parou de tropeçar no próprio pé.
O Google se posiciona para competir pela liderança comercial de um mercado em que a liderança tecnológica sempre pertenceu à empresa.
Os vídeos impressionam. O Gemini é multimodal. É capaz de entender e interpretar não só textos, mas dados, análises, códigos e imagens.
O fato é que todo mundo usa algo do ecossistema Google em algum momento do seu dia – e todo dia. Então, para muita gente será a partir de agora que a experiência de usar IA vai passar a fazer parte da rotina. Esta é a grande diferença que o Gemini traz, independente dos detalhes de suas (muitas) funcionalidades.
O Gemini se destaca por sua versatilidade, operando tanto em grandes infraestruturas de data centers quanto em dispositivos móveis.
Google planeja lançar três versões do Gemini:
Gemini Ultra: maior e mais poderoso, voltado para tarefas altamente complexas – será liberado apenas em 2024;
Gemini Pro: voltado rodar uma ampla gama de tarefas e atender a desenvolvedores e usuários – começa a ser liberado nesta quarta;
Gemini Nano: criado para dispositivos móveis, vai rodar diretamente no dispositivo, o que lhe permite funcionar mesmo quando não há internet – disponível no Pixel 8 Pro, o celular do Google, para criar resumos de áudios e sugerir respostas inteligentes no WhatsApp.
A versão Pro do Gemini já começa a integrar o robô Bard do Google, melhorando suas capacidades de raciocínio e compreensão. Outros produtos da empresa, como Busca e Chrome, também receberão integração com o Gemini nos próximos meses.
A partir de 13 de dezembro, desenvolvedores e empresas poderão acessar o Gemini Pro através das plataformas Google AI Studio e Google Cloud Vertex AI, enquanto o Gemini Ultra passará por verificações de segurança adicionais antes de seu lançamento em 2024.
O diferencial do Gemini em relação a outras inteligências artificiais (IA) multimodais reside na sua abordagem de desenvolvimento.
Segundo Demis Hassabis, diretor-executivo da DeepMind, subsidiária de IA do Google, o Gemini foi projetado para ser nativamente multimodal, sendo treinado desde o início em diferentes formatos e posteriormente aperfeiçoado com dados adicionais.
Além disso, o Gemini passou por rigorosas avaliações de segurança para evitar conteúdo inapropriado. Sua criação incluiu o treinamento sobre frases tóxicas e a colaboração de especialistas independentes para testar seus limites.