Após polêmica com Gemini, Google anuncia ferramenta de geração de vídeos

Kristina Behr fala sobre expectativas e o que mudou para uma plataforma que seja segura para os usuários

Author Photo
7:02 pm - 10 de abril de 2024
Kristina Behr fala sobre novo lançamento do Google Foto: Divulgação

Após pausar a geração de imagens de pessoas para o Gemini em fevereiro deste ano, o Google aposta em uma plataforma similar (porém de vídeos) para o Google Workspace. Chamado Google Vids, e com previsão de lançamento em junho deste ano, é um assistente de criação de vídeo com tecnologia de IA que interpreta dicas de escrita, produção e edição, possibilitando a geração de um storyboard e, após a escolha de um estilo, a composição de um primeiro rascunho com cenas sugeridas a partir de stock vídeos, imagens e música de fundo.

“O contexto do mercado é que o mundo está caminhando para a inovação baseada em vídeo. Vemos isso no cenário do consumidor, e isso certamente terá impacto na maneira como pensamos, por exemplo, como a Geração Z entra no mercado de trabalho, como podemos fazer com que eles vejam os vídeos como uma ótima maneira de expressar informações complexas”, explica Kristina Behr, vice-presidente de produtos no Google Workspace Collaboration, em coletiva de imprensa no Google Next ’24.

Apesar do tom positivo no lançamento, pergunto para a executiva o que mudou no desenvolvimento desse novo produto em relação à polêmica do Gemini apenas dois meses antes.

“No Workspace, estamos tentando focar na jornada do usuário. Qual o trabalho a ser feito? Então, a geração de imagens é como uma parte essencial da criação de um slide, de um documento ou para eventos futuros. E assim, da maneira como pensamos sobre os modelos subjacentes, estamos tentando extrair isso, para que os modelos avancem e imaginem que tudo fica melhor. E nós temos novidades futuras. Os usuários não darão um passo atrás nos recursos, nós apenas os aprimoraremos ao longo do caminho. Então, espero que esse tipo de dissociação nos dê um pouco mais de filosofia”, respondeu ela.

A ferramenta, comenta ela, inclui vários recursos diferentes de IA. O usuário pode pensar em textos, vídeos e outras ferramentas de IA para criar algo em um vídeo. Ou seja, por mais que seja usada a IA para guiar o caminho, também são usados recortes de transcriação para gerar resultados e modelos completos. “Poderíamos explorar todos os diferentes tipos de recursos de IA que as pessoas desejam e precisam para criar ótimos vídeos ou histórias.”

Kristina faz questão de dizer que o Google é cuidadoso e está implementando outras funcionalidades de IA. “Eu tenho muito orgulho do fato de estarmos sendo tão metódicos com o Google em relação ao desenvolvimento em torno de objetivos e resultados-chave. E nosso objetivo é o usuário, queremos criar um produto que nossos usuários sejam fãs, que seja intuitivo e realmente pronto para usar.”

Ela faz uma analogia com a covid e diz que, apesar de ser um vírus, resumi-lo totalmente, extraindo os trechos certos e dando as respostas certas, é mais difícil do que de uma forma mais ampla, pois cada corpo é diferente. “Mas estou feliz por termos feito certo. Estávamos deixando isso em nosso último programa para que pudéssemos resolver qualquer tipo de problema que tivermos.”

Entretanto, ao menos em um primeiro momento, as boas notícias são para quem tem inglês como língua nativa. Segundo a executiva, atualmente a empresa está trabalhando para obter conjuntos de dados e resultados excelentes em inglês para, depois, expandir para outros idiomas.

*a jornalista viajou a convite da empresa

Siga o IT Forum no LinkedIn e fique por dentro de todas as notícias! 

Author Photo
Laura Martins

Jornalista com mais de dez anos de atuação na cobertura de tecnologia. É a quarta jornalista de tecnologia mais admirada no Brasil, pelo prêmio “Os +Admirados da Imprensa de Tecnologia 2022” e tem a experiência de contribuições para o The Verge.

Author Photo

Newsletter de tecnologia para você

Os melhores conteúdos do IT Forum na sua caixa de entrada.