Google avança em machine learning em recursos de busca ‘mais visuais’

O Google anunciou nesta semana durante seu evento Search On 2022 atualizações importantes em seus serviços de busca possibilitados pelos avanços na tecnologia de machine learning ou aprendizado de máquina.

Otimizações nos modelos, segundo o Google, permitem que o recurso de tradução de imagens com o Lens – que se vale da câmera dos celulares para traduzir textos e cardápios ou letreiros, por exemplo – consiga traduzir textos sobre imagens em apenas 100 milissegundos, menos que um piscar de olhos.

“Grandes avanços na tecnologia de aprendizado de máquina permitem misturar textos traduzidos a imagens complexas, com um resultado tão natural que parece quase imperceptível”, explicou o Google sobre o progresso na tecnologia.

Antes, o Tradutor com o Lens cobria o texto original. Agora, ele passa a ser apagado. Ou seja: os pixels são recriados sobre um fundo gerado por inteligência artificial (IA), e o texto traduzido é sobreposto à imagem. Essa atualização do recurso estará disponível globalmente até o final do ano.

Outro uso de inteligência artificial e imagens para fins de busca está no novo recurso “neighborhood vibe” (atmosfera da vizinhança, em tradução livre). Com ele, será possível escolher um bairro e conhecer seus pontos mais populares por meio de fotos e informações úteis compartilhadas no próprio mapa por integrantes da comunidade Google Maps. Para fazer isso, o Google combinou a inteligência artificial aos conhecimentos locais de usuários do Maps que contribuem diariamente com mais de vinte milhões de avaliações, fotos e vídeos. A experiência chegará aos usuários do Google Maps nos próximos meses, disse o Google.

O Google tem trabalhado para tornar seu buscador um multisearch. Além da vocação inicial para a busca com texto, o buscador permite pesquisar por voz e por imagens usando o recurso do Lens. Com a nova modalidade de busca, é possível tirar uma fotografia ou usar uma imagem (ou um screenshot) e acrescentar texto a essa foto – da mesma forma com que a gente aponta para alguma coisa quando quer fazer uma pergunta sobre o que está vendo.

O Multisearch já está disponível globalmente em inglês, e ao longo dos próximos meses será lançado em mais de 70 idiomas, incluindo em português do Brasil.

Recent Posts

Propagandistas chineses usaram ChatGPT para gerar conteúdo contra tarifas de Trump e expansão de data centers nos EUA

A OpenAI divulgou na última quarta-feira um relatório revelando que propagandistas ligados à China utilizaram…

7 horas ago

Anthropic pede ao Congresso americano que preserve leis estaduais de IA na ausência de regulação federal robusta

A Anthropic enviou ao Congresso dos Estados Unidos, na última quarta-feira, uma série de recomendações…

8 horas ago

Leo conclui migração para SAP S/4HANA e acelera estratégia de digitalização

A Leo, maior revendedora de insumos para marcenaria do Brasil, finalizou a migração de seu…

8 horas ago

NTT Data cria AI Office no Brasil para acelerar a transformação empresarial com IA

A NTT Data criou um AI Office no Brasil, uma iniciativa estratégica para inovar no…

9 horas ago

IA reduz em 90% o tempo de transcrição de acervo histórico da Santa Casa de Porto Alegre

O Centro Histórico-Cultural da Santa Casa de Porto Alegre encontrou na inteligência artificial uma forma…

10 horas ago

LinkedIn chega a 100 milhões de usuários no Brasil e mira a era dos agentes de IA

O LinkedIn anunciou hoje (10), em evento para imprensa em São Paulo, a marca de…

11 horas ago