Notícias

Tecnologia de Inteligência Artificial do Google faz leitura labial melhor que pessoas

A Universidade de Oxford e a divisão de Inteligência Artificial do Google, chamada de Deep Mind, conseguiram criar o software de leitura labial mais preciso do mundo.

Para treinar a plataforma de rede neural, e obter esse resultado, os cientistas usaram mais de 5 mil horas de programação de TV da rede britânica BBC, incluindo atrações como Newsnight e World Today, que totalizaram mais de 118 mil sentenças diferentes.

Segundo os pesquisadores, o software, chamado de “Watch, Listen, Attend, and Spell“, conseguiu registrar uma precisão de 46,8% na leitura labial dos participantes dos programas. Bem mais do que os 12,4% de precisão registrados por um ser humano especialista em leitura labial com os mesmos vídeos.

Esse projeto segue um trabalho parecido publicado no início do mês pela Universidade de Oxford, que usou técnicas parecidas para criar um programa de leitura labial chamado LipNet, que conseguiu 93,4% de precisão nos testes contra 52,4% de um ser humano especialista na área. No entanto, o teste do programa usou filmagens de sentenças muito mais simples do que as utilizadas pelo novo projeto do Google e Oxford.

A tecnologia tem um amplo leque de aplicações, tais como permitir que pessoas com problemas auditivos possam compreender conversas transcritas a partir do reconhecimento labial do interlocutor, se integrada em óculos de realidade aumentada. Desta forma, bastaria apenas olhar para uma pessoa para saber o que ela diz. 

É possível ainda melhorar as capacidades de assistentes virtuais como o Google Now, a Siri ou a Cortana.

Ou transcrever diálogos a partir de imagens capturadas de câmeras de segurança, ainda que não tenham a mesma qualidade e iluminação das imagens de um programa de TV.  Não deixa de ser preocupante pensar que no futuro essa tecnologia pode vir a ser usada com fins de vigilância.  Poderia haver violação do direito à privacidade, caso seja utilizada para “escutar” as conversas alheias ? 

Recent Posts

Unico processa Serasa Experian por suposto uso indevido de tecnologia de biometria facial

A Unico, empresa brasileira especializada em identidade digital e biometria facial, ingressou com ações nas…

12 horas ago

Salesforce leva Agentforce à Copa do Mundo de 2026

A Salesforce anunciou parceria com a FIFA como apoiadora oficial da Copa do Mundo de…

13 horas ago

Neil Redding abre IT Forum Praia do Forte 2026 com debate sobre liderança na era da IA

Neil Redding será o palestrante de abertura do IT Forum Praia do Forte 2026. Com…

14 horas ago

47% das empresas brasileiras devem adiar migração para a nuvem nos próximos três anos

Apesar da consolidação da computação em nuvem como um dos pilares da transformação digital, uma…

14 horas ago

Deepfakes, IA e software open source lideram lista de ameaças críticas para empresas, diz Gartner

As equipes de segurança cibernética enfrentarão um cenário cada vez mais complexo nos próximos anos,…

16 horas ago

Apenas um em cada três americanos aprova a construção de data centers

Apenas uma em cada três pessoas dos Estados Unidos aprova o ritmo acelerado de construção…

17 horas ago