Notícias

Pesquisadores desenvolvem inteligência artificial capaz de ler lábios em vídeos

Pesquisadores da empresa chinesa Alibaba, da Universidade de Zhejiang e do Instituto de Tecnologia Stevens, nos Estados Unidos, desenvolveram um sistema que usa tecnologia de reconhecimento facial, inteligência artificial e machine learning para identificar quais palavras foram ditas por alguém em um vídeo. O sistema foi batizado de “Lip by Speech” (LIBS).

Essa não é a primeira vez que pesquisadores desenvolvem sistemas de reconhecimento de palavras em vídeo. Em 2016, um sistema desenvolvido pelo Google em parceria com a Universidade de Oxford era capaz de ler lábios em vídeos, com precisão de acerto em cerca de 46,8%.

De acordo com o Venture Beat, o LIBS consegue extrair informações de grande utilidade e em vários níveis como nível de sequência e nível de contexto. Com essas informações, o sistema alinha esses dados com os dados do vídeo, identificando a correspondência entre eles e, com isso, gera um texto das palavras que foram ditas no vídeo.

Os pesquisadores observam que o modelo demorou para conseguir resultados “razoáveis”. No entanto, após um pré-treinamento com frases de até 16 palavras, a inteligência artificial foi capaz de melhorar sua qualidade de identificação de palavras, otimizando seus resultados, principalmente em nível de contexto.

Por que isso importa

O LIBS pode ser usado em projetos com objetivo de ajudar aqueles que portam dificuldades auditivas, mas querem consumir conteúdos em vídeo que não foram legendados, como matérias ao vivo, por exemplo. Essa tecnologia pode ser muito eficiente na garantia de acessibilidade das 466 milhões de pessoas no mundo que sofrem de perda auditiva, ou cerca de 5% da população mundial, como informa a Organização Mundial da Saúde (OMS).

No entanto, vale lembrar que a mesma tecnologia poderia ser usada para fins de vigilância de regimes totalitários, como a China tem empregado o seu sistema de reconhecimento facial em locais públicos como ruas e aeroportos.

Recent Posts

Propagandistas chineses usaram ChatGPT para gerar conteúdo contra tarifas de Trump e expansão de data centers nos EUA

A OpenAI divulgou na última quarta-feira um relatório revelando que propagandistas ligados à China utilizaram…

4 horas ago

Anthropic pede ao Congresso americano que preserve leis estaduais de IA na ausência de regulação federal robusta

A Anthropic enviou ao Congresso dos Estados Unidos, na última quarta-feira, uma série de recomendações…

5 horas ago

Leo conclui migração para SAP S/4HANA e acelera estratégia de digitalização

A Leo, maior revendedora de insumos para marcenaria do Brasil, finalizou a migração de seu…

5 horas ago

NTT Data cria AI Office no Brasil para acelerar a transformação empresarial com IA

A NTT Data criou um AI Office no Brasil, uma iniciativa estratégica para inovar no…

6 horas ago

IA reduz em 90% o tempo de transcrição de acervo histórico da Santa Casa de Porto Alegre

O Centro Histórico-Cultural da Santa Casa de Porto Alegre encontrou na inteligência artificial uma forma…

7 horas ago

LinkedIn chega a 100 milhões de usuários no Brasil e mira a era dos agentes de IA

O LinkedIn anunciou hoje (10), em evento para imprensa em São Paulo, a marca de…

8 horas ago