A visão computacional está preparada para o valor do negócio

Empresas de vários setores estão implantando inteligência artificial baseada em imagem e vídeo

Author Photo
9:40 am - 29 de junho de 2022
IA, inteligência artificial, executivo Foto: Shutterstock

Nos últimos anos, os aplicativos de visão computacional tornaram-se onipresentes. De telefones que reconhecem os rostos de seus usuários, a carros que dirigem sozinhos, a satélites que rastreiam os movimentos dos navios, o valor da visão computacional nunca foi claro.

Mas a escassez de hardware e as interrupções de trabalho na esteira da pandemia estão desafiando a capacidade das empresas de cumprir a promessa da visão computacional, mesmo que a própria pandemia tenha acelerado o potencial de seus casos de uso.

Veja a seguir como as empresas de vários setores estão implantando a visão computacional para melhorar e otimizar os principais processos de negócios, desde o atendimento de varejo até o diagnóstico de saúde.

O que é visão computacional?

A visão computacional é um campo da inteligência artificial focado no processamento de imagens e vídeos para extrair informações significativas. Exemplos de visão computacional em ação incluem reconhecimento óptico de caracteres, reconhecimento de imagem, reconhecimento de padrões, reconhecimento facial e detecção e classificação de objetos.

Os setores que fazem uso intenso da visão computacional incluem manufatura, saúde, automotivo, agricultura e logística e cadeia de suprimentos. Nas empresas, os principais impulsionadores para a implantação da visão computacional incluem automação, melhoria de processos e produtividade e conformidade regulatória e segurança.

“O mercado está crescendo tão rápido que é difícil acompanhá-lo”, diz Matt Arcaro, Analista do IDC, acrescentando que a pandemia acelerou a adoção da visão computacional – por exemplo, para monitorar a ocupação para ajudar a garantir o distanciamento social ou acompanhar como muitas pessoas estavam usando transporte público.

“Como há muitas câmeras CCTV instaladas, é uma atualização elegante” para incorporar a visão computacional, diz Arcaro. “E, em muitos casos, devido a mandatos governamentais ou escolhas organizacionais, os dólares de investimento estão lá”.

De acordo com o IDC, o mercado mundial total de tecnologias de visão computacional crescerá para US$ 2,1 bilhões este ano, de US$ 760 milhões em 2020, com uma taxa de crescimento anual composta de 57% prevista até 2025, para um valor total de mercado de US$ 7,2 bilhões.

A maior parte desse mercado está atualmente on-prem, mas o IDC espera que as implantações de nuvem pública representem 48% dos gastos com visão computacional até 2025.

Dimensionamento e agilização do atendimento e entrega de varejo

O setor de varejo sofreu uma interrupção dramática durante a pandemia, com os clientes migrando mais de suas compras on-line e mudando cada vez mais para entrega em domicílio.

O Walmart, por exemplo, informou que o número de compradores que entregam suas compras aumentou seis vezes em comparação com antes da pandemia. Para enfrentar o desafio, a rede multinacional de hipermercados aumentou a capacidade de coleta e entrega em 20% no ano passado e planeja aumentar mais 35% este ano.

Para que isso aconteça, o Walmart está investindo em diversas categorias de tecnologia equipadas com visão computacional, incluindo drones e veículos autônomos. A empresa anunciou em julho passado planos para lançar robôs da Symbotic em 25 de seus 42 centros de distribuição regionais. Os robôs usam visão computacional, entre outras tecnologias de IA, para movimentar mercadorias pelos armazéns.

Enquanto isso, a rede de supermercados americana Kroger vem investindo em centros de microatendimento – armazéns de distribuição de pequena escala e altamente automatizados localizados perto de onde os clientes moram. O objetivo é entregar mantimentos aos clientes em menos de 30 minutos, de acordo com a empresa. Desde o verão passado, a Kroger abriu instalações na Flórida, Alabama, Texas, Califórnia, Ohio e Geórgia, e planeja abrir mais 17 instalações, incluindo hubs e spokes, nos próximos 24 meses.

Em um hub site, mais de 1.000 bots “giram em torno de grades 3D gigantes, orquestradas por sistemas proprietários de controle de tráfego aéreo”, segundo a empresa. Em vez de movimentar pallets inteiros de produtos, como acontece em um centro de distribuição regional, aqui os robôs buscam itens individuais. A visão computacional é usada para classificar e embalar itens de modo que, por exemplo, itens pesados fiquem no fundo e as malas tenham o mesmo peso.

A empresa de varejo sob demanda Fabric, especializada em centros de microatendimento para varejistas que não podem construir seus próprios, usa automação extensivamente em suas instalações, diz o cofundador Ori Avraham. “Usamos a visão computacional como um recurso chave de nossa solução robótica”, diz ele. “Por exemplo, a navegação precisa dos robôs no chão é baseada na análise visual de adesivos de piso. Esse processo acontece em tempo real como parte da navegação do robô”.

Os braços robóticos de colheita também usam visão computacional, diz ele. “Para isso, usamos um algoritmo de segmentação e classificação que nos permite pegar e colocar itens. Ambos os recursos são cruciais para nossa capacidade de operar nossos microcentros de atendimento com sucesso”.

No mês passado, a Fabric inaugurou um novo centro de microatendimento em Dallas, somando-se às suas operações existentes em Nova York; Washington DC; e Telavive. Possui parcerias com Walmart, Instacart e FreshDirect e planeja dobrar sua rede de centros de microatendimento até o final do ano.

Simplificando e melhorando os processos de fabricação

A manufatura é outra indústria que está sendo revolucionada pela visão computacional, que é amplamente utilizada em linhas de produção para inspecionar produtos, automatizar processos e otimizar a produtividade.

Mike Griffin, Cientista-Chefe de Dados da Insight, uma empresa de consultoria de tecnologia com sede em Tempe, Arizona, trabalhou com vários clientes de manufatura em projetos de visão computacional. Uma parceria envolveu o desenvolvimento de um sistema no qual um dispositivo portátil poderia ser usado para tirar uma fotografia de uma caixa de produtos e fornecer automaticamente uma contagem do número de produtos na caixa.

“[O cliente] queria poder contratar pessoas com deficiência para fazer a contagem”, diz Griffin. “Parece um sistema fácil de desenvolver, mas o desafio é que o aplicativo de visão tem que fazer mais do que interpretar o que pode ver, mas também interromper o que não pode”.

Os produtos podem ser empilhados uns sobre os outros, ocultando os que estão na parte inferior. Assim, o sistema de visão computacional teve que pegar uma imagem bidimensional e traduzi-la em um modelo tridimensional. “Precisávamos ter pelo menos 80% de precisão em nosso inventário, incluindo caixas embrulhadas em plástico transparente com muito brilho”, diz Griffin.

Para treinar o sistema, os funcionários caminharam com celulares e gravaram vídeos. Em seguida, um estagiário rotulou manualmente 500 imagens tiradas desses vídeos, contendo 30.000 caixas. Poucas imagens foram necessárias porque a visão computacional é uma área relativamente madura da inteligência artificial, com muitos modelos pré-treinados. Por exemplo, para criar um novo modelo para um conjunto de dados personalizado, como caixas, é usado o aprendizado de transferência.

“Vamos pegar um modelo que foi treinado em milhões de imagens de gatos e cachorros e carros e outros enfeites”, diz Griffin. “Então, muito do trabalho duro já foi feito. E então podemos adicionar nossas 500 imagens de caixas ou 1.000 imagens de pneus a esse modelo e retreiná-lo com esse conjunto adicional de imagens”.

O aprendizado de transferência permite um treinamento de modelo mais rápido, com conjuntos de dados menores, do que seria possível. “Você também pode criar dados sintéticos”, acrescenta Griffin. “Por exemplo, uma empresa de construção queria identificar perigos e eles tinham apenas algumas centenas de imagens de treinamento. Criamos imagens adicionais, colocando esses cones de perigo laranja em, digamos, um campo ou estacionamento, para aumentar seu conjunto de imagens para impulsionar esse treinamento”.

Outro uso inovador do processamento de imagens na manufatura é traduzir os dados de teste em imagens e, em seguida, usar o machine learning nas imagens geradas.

“As falhas de teste podem estar próximas umas das outras, mas não é óbvio que estejam relacionadas umas às outras até que você traduza esses dados em imagens”, diz Griffin. “Eles estão próximos um do outro no espaço de teste, em vez de estarem próximos um do outro no espaço físico”.

Melhorando o diagnóstico de saúde

Na área da saúde, a visão computacional é amplamente usada em diagnósticos, como na interpretação de imagem e vídeo com inteligência artificial. Também é usado para monitorar a segurança dos pacientes e melhorar as operações de saúde, diz Tuong Nguyen, Analista do Gartner.

“O potencial para a visão computacional é enorme”, diz ele. “É basicamente ajudar as máquinas a entender o mundo. As aplicações são infinitas — na verdade, tudo o que você precisa ver. O mundo inteiro”.

De acordo com a quarta pesquisa anual da Optum sobre IA na área da saúde, lançada no final de 2021, 98% das organizações de saúde já têm uma estratégia de IA ou planejam implementar uma, e 99% dos líderes de saúde acreditam que a IA pode ser confiável para uso nos cuidados de saúde.

A interpretação de imagens médicas foi uma das três principais áreas citadas pelos entrevistados em que a IA pode ser usada para melhorar os resultados dos pacientes. As outras duas áreas, atendimento virtual ao paciente e diagnóstico médico, também estão prontas para a visão computacional.

Tomemos, por exemplo, a fibrose pulmonar idiopática, uma doença pulmonar mortal que afeta centenas de milhares de pessoas em todo o mundo. A doença não tem causa ou cura conhecida e é muito difícil de diagnosticar. Só nos EUA, cerca de 40.000 pessoas morrem da doença todos os anos.

De acordo com a PwC, normalmente leva mais de dois anos para que a fibrose pulmonar idiopática seja diagnosticada; até então, a expectativa de vida média daqueles finalmente diagnosticados é de apenas três a cinco anos.

O repositório de dados do Open Source Imaging Consortium, apoiado pela PwC e pela Microsoft, está construindo uma plataforma para compartilhar dados de imagem anônimos para ajudar no diagnóstico da doença. Até o final deste ano, a organização espera ter 15.000 scans em seu banco de dados.

Com IA e machine learning, os médicos podem diagnosticar a doença com mais rapidez e precisão, dando-lhes mais tempo para tratar os pacientes.

E, no futuro, a mesma plataforma também poderá ser utilizada para outras doenças raras.

Outras indústrias sendo transformadas pela visão computacional

No setor automotivo, a visão computacional é usada para auxiliar os motoristas e monitorar os motoristas para garantir que eles estejam prestando atenção na estrada. Também é fundamental para permitir carros autônomos, um importante motor de crescimento para o uso de visão computacional na indústria automotiva, diz Aracaro, do IDC.

Mas há outro mercado importante para direção autônoma e visão computacional em geral, diz Arcaro: Agricultura. “A John Deere está fazendo algo realmente crítico lá”, diz ele, observando que a visão computacional também está sendo usada na agricultura para classificar produtos, monitorar a saúde de plantas e animais e monitorar e gerenciar ativos agrícolas.

Na segurança cibernética, a análise de imagens pode ser usada para ler assinaturas ou identificar sites de phishing projetados para se parecerem com sites reais, mas diferentes o suficiente para evitar outros métodos de detecção.

No setor de hospitalidade, a visão computacional ajuda a rastrear onde os hóspedes vão a bordo de navios de cruzeiro para melhorar sua experiência.

No setor de serviços financeiros, o processamento de imagens captura dados de documentos para melhorar a eficiência dos processos de negócios.

“[A visão computacional] abrange quase todos os setores”, diz Dinesh Batra, Vice-Presidente de Dados e Inteligência Artificial da Capgemini Invent. “Tem sido uma ferramenta de enorme sucesso para as empresas nos últimos anos – e sua proeminência só continuará a acelerar”.

Futuro visivelmente brilhante

E, no entanto, apesar da abundância de casos de uso já empregados, a visão computacional tem espaço significativo para crescimento.

“Ainda é cedo”, diz Nguyen, do Gartner. “Espero ver mais fornecedores aparecendo neste espaço abordando diferentes elementos da cadeia de valor. Ainda há muitas oportunidades por vir à medida que a tecnologia fica melhor, mais barata e mais acessível. Vamos começar a vê-la sendo usada em qualquer lugar e em todos os lugares”.

Nem tudo é uma navegação tranquila, no entanto. De acordo com o Gartner, os obstáculos à adoção incluem escassez de hardware e falta de recursos de processamento. Em algumas aplicações, ainda há problemas com a precisão. Os sistemas de visão computacional também precisam ser integrados às linhas de produção, bem como aos sistemas de back-end, os quais podem ser um desafio.

Portanto, embora a Covid-19 tenha aumentado a demanda e o potencial da visão computacional nos negócios, a escassez de hardware e as interrupções de trabalho causadas pela pandemia tornaram difícil para muitas empresas até agora capitalizar a promessa da tecnologia.

Mas à medida que esses problemas diminuem no futuro, as empresas certamente estarão preparadas para dar uma olhada mais de perto na tecnologia.

Newsletter de tecnologia para você

Os melhores conteúdos do IT Forum na sua caixa de entrada.