Domingo, 12 de janeiro de 2025
Por Redação O Sul | 13 de dezembro de 2023
Após alguns adiamentos, o Google finalmente lançou Gemini, sua nova e mais poderosa ferramenta de inteligência artificial (IA). O modelo de linguagem multimodal (LLM, na sigla em inglês) é a tecnologia mais avançada da big tech, e promete ser um grande passo na chamada “corrida da IA”.
O Google afirma que a sua ferramenta é superior ao GPT-4, desenvolvido pela OpenAI, e é o resultado de um esforço colaborativo em grande escala que envolveu vários times da companhia, incluindo as equipes do Google DeepMind e Google Research.
Gemini é a IA mais recente do Google, projetada para ser mais poderosa que o modelo anterior, o Bard. Segundo a empresa, o modelo multimodal tem capacidade de organizar, compreender, operar e combinar diferentes tipos de informação, incluindo comandos enviados por textos, imagens, vídeos, áudios ou códigos (linguagens de programação).
O objetivo é que essa seja a “IA carro-chefe” do Google, alimentando diversos produtos e serviços do portfólio da empresa. De acordo com o CEO e cofundador do Google DeepMind, Demis Hassabis, o Gemini é o modelo mais “capaz” que alguém já construiu.
Como funciona o Gemini? O Google descreve o Gemini como um modelo flexível capaz de funcionar em tudo, desde os data centers do Google até dispositivos móveis. Para alcançar essa escalabilidade, a IA está sendo lançado em três tamanhos: Gemini Nano, Gemini Pro e Gemini Ultra.
– Gemini Nano: o modelo Nano foi projetado para funcionar em smartphones, especificamente no Google Pixel 8. Ele foi desenvolvido para executar tarefas no dispositivo que exigem processamento de IA eficiente sem conexão com servidores externos, como sugerir respostas em aplicativos de bate-papo ou resumir texto;
– Gemini Pro: rodando nos data centers do Google, o Gemini Pro foi projetado para alimentar a versão mais recente do Bard. A IA é capaz de fornecer tempos de resposta rápidos e compreender consultas complexas.
– Gemini Ultra: ainda indisponível para uso geral, o Google descreve o Gemini Ultra como seu modelo mais eficaz, e foi projetado para executar tarefas altamente complexas.
Diferenciais
Ao contrário de outros modelos LLM, o Google Gemini foi construído para ser multimodal desde o início. Isso é o que garante à ferramenta conseguir compreender e combinar diferentes tipos de dados de uma forma mais natural do que o entregue pelas IAs até agora.
A ferramenta foi treinada em chips de IA internos e unidades de processamento de tensores do Google, como TPU v4 e v5e. Para os especialistas, esse é um dos modelos mais flexíveis do mercado e um dos mais eficientes. E
Como prova de que Gemini “é mais inteligente que o ChatGPT”, o Google afirma que sua IA fez uma pontuação de 90% no teste de Compreensão Massiva de Linguagem Multitarefa (MMLU, na sigla em inglês), que combina assuntos como história, matemática, medicina, física e ética – o modelo mais avançado da OpenAI tem uma pontuação de 86%.
O Gemini já está disponível? O Gemini Pro já está disponível para usuários em mais de 170 países, através do Bard e apenas na versão em inglês. “Essa é a maior melhoria de qualidade do Bard desde o seu lançamento”, afirma o Google.
O Gemini Nano também já disponível para smartphones, por enquanto apenas para o modelo Pixel 8. Desenvolvedores e clientes corporativos também poderão acessar o Gemini Pro por meio da API Gemini no AI Studio do Google e no Google Cloud Vertex AI a partir de 13 de dezembro.
Segundo a empresa, nos próximos meses a IA estará disponível em mais produtos e serviços do Google, como a Busca, Ads, Chrome e Duet AI. Já o Gemini Ultra chega ao mercado só no início de 2024.
Como usar
Como, por enquanto, o Gemini só funciona dentro do Bard na versão em inglês, o usuário precisa alterar o idioma da sua conta do Google para experimentar a IA.
– Acesse a sua conta do Google;
– Clique nos três pontos no canto superior direito da tela e selecione ‘Configurações’;
– Depois, clique em “gerenciar sua conta do Google”;
– Clique em “Informações pessoais” e procure por “Preferências gerais para a Web”;
– Selecione “Idioma” e salve o inglês como preferido.
– Depois de fazer a alteração, é só navegar normalmente no Bard, pois a tecnologia é integrada à plataforma. A interação pode ser feita através de perguntas (ou conversas) com a IA através de textos ou áudios, fazendo o upload ou vídeo de imagens para identificação. As informações são da revista Época.