All Rights ReservedView Non-AMP Version
IT Forum
  • Homepage
  • Inovação
Notícias

Pesquisadores desenvolvem inteligência artificial capaz de ler lábios em vídeos

Pesquisadores da empresa chinesa Alibaba, da Universidade de Zhejiang e do Instituto de Tecnologia Stevens, nos Estados Unidos, desenvolveram um sistema que usa tecnologia de reconhecimento facial, inteligência artificial e machine learning para identificar quais palavras foram ditas por alguém em um vídeo. O sistema foi batizado de “Lip by Speech” (LIBS).

Essa não é a primeira vez que pesquisadores desenvolvem sistemas de reconhecimento de palavras em vídeo. Em 2016, um sistema desenvolvido pelo Google em parceria com a Universidade de Oxford era capaz de ler lábios em vídeos, com precisão de acerto em cerca de 46,8%.

As melhores notícias de tecnologia B2B
Acompanhe todas as novidades diretamente na sua caixa de entrada

De acordo com o Venture Beat, o LIBS consegue extrair informações de grande utilidade e em vários níveis como nível de sequência e nível de contexto. Com essas informações, o sistema alinha esses dados com os dados do vídeo, identificando a correspondência entre eles e, com isso, gera um texto das palavras que foram ditas no vídeo.

Os pesquisadores observam que o modelo demorou para conseguir resultados “razoáveis”. No entanto, após um pré-treinamento com frases de até 16 palavras, a inteligência artificial foi capaz de melhorar sua qualidade de identificação de palavras, otimizando seus resultados, principalmente em nível de contexto.

Por que isso importa

O LIBS pode ser usado em projetos com objetivo de ajudar aqueles que portam dificuldades auditivas, mas querem consumir conteúdos em vídeo que não foram legendados, como matérias ao vivo, por exemplo. Essa tecnologia pode ser muito eficiente na garantia de acessibilidade das 466 milhões de pessoas no mundo que sofrem de perda auditiva, ou cerca de 5% da população mundial, como informa a Organização Mundial da Saúde (OMS).

No entanto, vale lembrar que a mesma tecnologia poderia ser usada para fins de vigilância de regimes totalitários, como a China tem empregado o seu sistema de reconhecimento facial em locais públicos como ruas e aeroportos.

Next Ex-Google e ex-Facebook, Bret Taylor é promovido a cargo de COO da Salesforce »
Previous « O que determina uma carreira?
Share
Published by
Redação
Tags: inovação
7 anos ago

    Related Post

  • Unimed-BH migra 500 servidores em três meses após reajuste
  • SpaceX projeta receita de US$ 1 trilhão até 2030 e amplia debate sobre valuation após IPO histórico
  • Nvidia aposta em PCs com IA para ampliar uso local de modelos avançados

Recent Posts

  • Notícias

Fortinet identifica mais de 1.140 domínios maliciosos ligados à Copa do Mundo de 2026

A proximidade da Copa do Mundo de 2026 tem impulsionado não apenas o interesse dos…

11 minutos ago
  • Notícias

Mercado de SaaS na América Latina deve atingir US$ 46 bilhões até 2027, com Brasil liderando crescimento

O mercado de Software como Serviço (SaaS) na América Latina deve movimentar US$ 46 bilhões…

55 minutos ago
  • Notícias

SpaceX projeta receita de US$ 1 trilhão até 2030 e amplia debate sobre valuation após IPO histórico

A SpaceX elevou as expectativas do mercado sobre seu potencial de crescimento após seu IPO…

2 horas ago
  • Notícias

Tim protege 12 mil endpoints em menos de 20 dias e reforça operação de cibersegurança

A Tim Brasil concluiu uma iniciativa de modernização de sua operação de cibersegurança que resultou…

3 horas ago
  • Notícias

Unimed-BH migra 500 servidores em três meses após reajuste

A Unimed-BH enfrentou um choque de custos que serviu de gatilho para uma das maiores…

3 horas ago
  • Notícias

Leroy Merlin alcança ROI de 220% com estratégia de comunicação baseada em IA conversacional

Em sua primeira campanha utilizando o RCS (Rich Communication Services) da Blip, a Leroy Merlin…

4 horas ago
All Rights ReservedView Non-AMP Version
  • L