Google avança em machine learning em recursos de busca ‘mais visuais’

O Google anunciou nesta semana durante seu evento Search On 2022 atualizações importantes em seus serviços de busca possibilitados pelos avanços na tecnologia de machine learning ou aprendizado de máquina.

Otimizações nos modelos, segundo o Google, permitem que o recurso de tradução de imagens com o Lens – que se vale da câmera dos celulares para traduzir textos e cardápios ou letreiros, por exemplo – consiga traduzir textos sobre imagens em apenas 100 milissegundos, menos que um piscar de olhos.

“Grandes avanços na tecnologia de aprendizado de máquina permitem misturar textos traduzidos a imagens complexas, com um resultado tão natural que parece quase imperceptível”, explicou o Google sobre o progresso na tecnologia.

Antes, o Tradutor com o Lens cobria o texto original. Agora, ele passa a ser apagado. Ou seja: os pixels são recriados sobre um fundo gerado por inteligência artificial (IA), e o texto traduzido é sobreposto à imagem. Essa atualização do recurso estará disponível globalmente até o final do ano.

Outro uso de inteligência artificial e imagens para fins de busca está no novo recurso “neighborhood vibe” (atmosfera da vizinhança, em tradução livre). Com ele, será possível escolher um bairro e conhecer seus pontos mais populares por meio de fotos e informações úteis compartilhadas no próprio mapa por integrantes da comunidade Google Maps. Para fazer isso, o Google combinou a inteligência artificial aos conhecimentos locais de usuários do Maps que contribuem diariamente com mais de vinte milhões de avaliações, fotos e vídeos. A experiência chegará aos usuários do Google Maps nos próximos meses, disse o Google.

O Google tem trabalhado para tornar seu buscador um multisearch. Além da vocação inicial para a busca com texto, o buscador permite pesquisar por voz e por imagens usando o recurso do Lens. Com a nova modalidade de busca, é possível tirar uma fotografia ou usar uma imagem (ou um screenshot) e acrescentar texto a essa foto – da mesma forma com que a gente aponta para alguma coisa quando quer fazer uma pergunta sobre o que está vendo.

O Multisearch já está disponível globalmente em inglês, e ao longo dos próximos meses será lançado em mais de 70 idiomas, incluindo em português do Brasil.

Recent Posts

Tecnologias exponenciais: como elas se aplicam ao seu negócio

As tecnologias exponenciais são aquelas que demonstram rápido desenvolvimento, apresentando um potencial de transformação imenso…

38 minutos ago

Rio Grande do Sul: operadoras de telefonia liberam internet grátis

As operadoras de telefonia Claro, TIM e Vivo tomaram a iniciativa de liberar o acesso…

57 minutos ago

Nascidos na era verde: como contratar e reter essa geração?

Durante o IT Forum Trancoso 2024, executivos discutiram as estratégias para contratar e reter a…

2 horas ago

Entre healthtechs brasileiras, 89 aplicam inteligência artificial

As startups ativas do setor de saúde – ou healthtechs – alcançaram o número de…

3 horas ago

Humanware Journal: previsões para o mercado de tecnologia nos próximos anos

Que tal fazer um diário do futuro para que possamos revisitá-lo? Essa foi a proposta…

19 horas ago

O desafio da interseção entre IA e princípios éticos no código

Num cenário empresarial cada vez mais competitivo e tecnologicamente avançado, a adoção de uma abordagem…

20 horas ago