Google anuncia Gemini, seu modelo mais avançado e hábil de IA

IA consegue compreender, operar e combinar diferentes tipos de informação, incluindo textos, imagens, áudios, vídeos e linguagens de programação

Publicado: 08/12/2023 às 13:00

Redação

Leitura 4 minutos

Imagem: Shutterstock — Foto: Imagem: Shutterstock

O Google anunciou nessa quarta-feira (6/12) o que chama do seu “modelo de IA mais avançado e o maior projeto científico e tecnológico que a empresa já desenvolveu até agora”. Batizado de Gemini, a o seu modelo avançado de IA é resultado de um esforço colaborativo em grande escala que envolveu vários times do Google, incluindo as equipes do Google DeepMind e Google Research.

De acordo com o anúncio da empresa, o Gemini é um modelo de IA multimodal, com capacidade de organizar, compreender, operar e combinar diferentes tipos de informação, incluindo textos, imagens, áudios, vídeos e linguagens de programação. Trata-se também do modelo de IA mais flexível do Google, capaz de funcionar com eficiência desde dispositivos móveis até data centers.

As melhores notícias de tecnologia B2B

Acompanhe todas as novidades diretamente na sua caixa de entrada

A gigante de tecnologia garante que sua resposta à avançada corrida de IA generativa vai melhorar significativamente a forma como os desenvolvedores e empresas constroem e escalam soluções com IA.

O Google explica que até agora, o método padrão para a criação de modelos multimodais envolvia treinar componentes separados para diferentes modalidades e depois juntá-los para imitar algumas dessas funcionalidades. Às vezes, esses modelos podem ser bons na execução de certas tarefas, como descrever imagens, mas enfrentam problemas com raciocínios mais conceituais e complexos.

“Por isso, projetamos o Gemini para ser um modelo multimodal nativo, ou seja, previamente treinado desde o início em diferentes modalidades. Em seguida, aperfeiçoamos o modelo com dados multimodais adicionais para refinar ainda mais a sua eficácia. Isso ajuda o Gemini a compreender e raciocinar perfeitamente sobre todos os tipos de informações desde o começo, de uma forma muito melhor do que os modelos multimodais existentes e com recursos de última geração em quase todos os domínios”, explicou em comunicado.

O Google garante ainda que o seu novo modelo de IA foi testado e seu desempenho avaliado rigorosamente em uma ampla variedade de tarefas. O desempenho do Gemini Ultra supera 30 dos 32 pontos das referências acadêmicas amplamente utilizados na pesquisa e no desenvolvimento de grandes modelos de linguagem.

Gemini chega a produtos do Google

A primeira versão do modelo, o Gemini 1.0, está sendo lançado em uma variedade de produtos e plataformas do Google.
Para os usuários, o Bard com Gemini Pro já está disponível em inglês em mais de 170 países e territórios . Ele terá capacidade de compreender, resumir, raciocinar, fazer brainstorming, escrever e planejar. Essa é a maior melhoria de qualidade do Bard desde o seu lançamento, segundo o Google.

O Gemini também já se encontra está disponível para o Pixel, smartphone da companhia. O Pixel 8 Pro é o primeiro smartphone projetado para rodar o Gemini Nano, que está potencializando novos recursos como “Summarize no aplicativo Recorder” e lançando o “Smart Reply” no Gboard, começando pelo WhatsApp e, no próximo ano, em mais aplicativos de mensagens.

Nos próximos meses, o Gemini estará disponível em mais dos principais produtos e serviços do Google, como a Busca, Ads, Chrome e Duet AI.

Gemini para empresas e desenvolvedores

Já para os clientes corporativos e desenvolvedores, a partir do dia 13 de dezembro, será possível acessar o Gemini Pro por meio da API do Gemini no Google AI Studio ou Vertex AI.

O Google AI Studio é uma ferramenta gratuita para desenvolvedores baseada na Web que ajuda desenvolvedores e clientes corporativos a criar protótipos e lançar aplicativos rapidamente com uma chave de API. A Vertex AI permitirá a personalização do Gemini com controle total de dados, beneficiando-se de recursos adicionais do Google Cloud para segurança empresarial, proteção, privacidade e governança e conformidade de dados.

Os desenvolvedores Android também poderão construir com o Gemini Nano, modelo eficiente para tarefas em dispositivos móveis, via AICore, que é um novo recurso de sistema disponível no Android 14, começando em dispositivos Pixel 8 Pro.

Para o início de 2024, o Google promete lançar o Bard Advanced, uma nova experiência de IA avançada, a partir da qual será possível acessar os melhores modelos e capacidades, começando pelo Gemini Ultra.

Siga o IT Forum no LinkedIn e fique por dentro de todas as notícias!