Google avança em machine learning em recursos de busca ‘mais visuais’

O Google anunciou nesta semana durante seu evento Search On 2022 atualizações importantes em seus serviços de busca possibilitados pelos avanços na tecnologia de machine learning ou aprendizado de máquina.

Otimizações nos modelos, segundo o Google, permitem que o recurso de tradução de imagens com o Lens – que se vale da câmera dos celulares para traduzir textos e cardápios ou letreiros, por exemplo – consiga traduzir textos sobre imagens em apenas 100 milissegundos, menos que um piscar de olhos.

“Grandes avanços na tecnologia de aprendizado de máquina permitem misturar textos traduzidos a imagens complexas, com um resultado tão natural que parece quase imperceptível”, explicou o Google sobre o progresso na tecnologia.

Antes, o Tradutor com o Lens cobria o texto original. Agora, ele passa a ser apagado. Ou seja: os pixels são recriados sobre um fundo gerado por inteligência artificial (IA), e o texto traduzido é sobreposto à imagem. Essa atualização do recurso estará disponível globalmente até o final do ano.

Outro uso de inteligência artificial e imagens para fins de busca está no novo recurso “neighborhood vibe” (atmosfera da vizinhança, em tradução livre). Com ele, será possível escolher um bairro e conhecer seus pontos mais populares por meio de fotos e informações úteis compartilhadas no próprio mapa por integrantes da comunidade Google Maps. Para fazer isso, o Google combinou a inteligência artificial aos conhecimentos locais de usuários do Maps que contribuem diariamente com mais de vinte milhões de avaliações, fotos e vídeos. A experiência chegará aos usuários do Google Maps nos próximos meses, disse o Google.

O Google tem trabalhado para tornar seu buscador um multisearch. Além da vocação inicial para a busca com texto, o buscador permite pesquisar por voz e por imagens usando o recurso do Lens. Com a nova modalidade de busca, é possível tirar uma fotografia ou usar uma imagem (ou um screenshot) e acrescentar texto a essa foto – da mesma forma com que a gente aponta para alguma coisa quando quer fazer uma pergunta sobre o que está vendo.

O Multisearch já está disponível globalmente em inglês, e ao longo dos próximos meses será lançado em mais de 70 idiomas, incluindo em português do Brasil.

Recent Posts

Novos executivos da semana: Dahua, Rimini Street, Arcserve e mais

O IT Forum traz, semanalmente, os novos executivos e os principais anúncios de contratações, promoções e…

1 dia ago

Sustentabilidade x IA: emissões da Microsoft sobem 30%

A Microsoft está enfrentando críticas após um relatório revelar um aumento alarmante em suas emissões…

2 dias ago

Centroflora integra e monitora ambientes industriais e automatiza manutenções

O Grupo Centroflora é um fabricante de extratos botânicos, óleos essenciais e ativos isolados para…

2 dias ago

8 oportunidades de vagas e cursos em TI

Toda semana, o IT Forum reúne as oportunidades mais promissoras para quem está buscando expandir…

2 dias ago

Fraudes: 58% das empresas dizem estar mais preocupadas no último ano

Um estudo divulgado na segunda-feira (13) pela Serasa Experian mostra que a preocupação com fraudes…

2 dias ago

82% dos ataques via USB podem interromper operações industriais

A Honeywell divulgou essa semana a sexta edição de seu Relatório de Ameaças USB de…

2 dias ago