Ferramenta da AWS ajuda em aprendizado de máquina

A Amazon Web Services (AWS) anunciou na última semana o Amazon SageMaker Ground Truth, que ajuda as empresas a criar conjuntos de dados de treinamento para aprendizado de máquina. Esse é um novo serviço para quem tem acesso a muitos dados que não foram anotados de forma consistente. No passado, a pessoa teria de rotular um corpus massivo de imagens ou molduras dentro do vídeo para treinar um modelo de visão computacional. Mas a plataforma usa aprendizado de máquina, além de humanos, para rotular automaticamente um conjunto de dados de treinamento.

Segundo Brandon Purcell, analista da Forrester, esse é um exemplo de um tema emergente no ano passado – aprendizado de máquina para aprendizado de máquina. Catálogos de dados de aprendizado de máquina (MLDCs), correspondência probabilística ou fuzzy, anotação de dados de treinamento automatizada e criação de dados sintéticos usam aprendizado de máquina para produzir ou preparar dados para subsequente aprendizado de máquina, resolvendo problemas com escassez ou dispersão de dados. Porém, o aprendizado de máquina por si só depende do raciocínio indutivo e, portanto, é baseado em probabilidade.

“Na realidade, ele poderá funcionar assim: um profissional de saúde gostaria de usar a visão computacional para diagnosticar uma doença rara. Por causa de dados esparsos, um anotador automatizado é usado para criar mais dados de treinamento (mais imagens rotuladas). O desenvolvedor define um limite de propensão de 90%, significando que apenas registros com uma probabilidade de 90% de serem classificados com precisão serão usados como dados de treinamento”, explicou.

Uma vez que o modelo é treinado e implantado, ele está sendo usado em pacientes cujos dados estão vinculados a vários bancos de dados usando a correspondência difusa em campos de dados de texto. Entidades de conjuntos de dados diferentes com 90% de chance de serem iguais são correspondidas. Finalmente, o modelo sinaliza imagens com 90% ou mais de probabilidade de descrever a doença para o diagnóstico.

O problema é que, tradicionalmente, os cientistas de dados e especialistas em aprendizado de máquina se concentram apenas nessa pontuação de propensão final como uma representação da exatidão geral da previsão. Isso funcionou bem em um mundo onde a preparação de dados que levou ao treinamento foi dedutiva e determinista.

Mas ao introduzir probabilidades em cima de probabilidades, essa pontuação de propensão final não é mais precisa. No caso acima, há um argumento a ser feito de que a probabilidade de um diagnóstico preciso diminui de 90% para 73% (90% x 90% x 90%) – o que não é o ideal em uma situação de vida ou morte.

Conforme a ênfase na necessidade de explicabilidade na AI aumenta, é necessário que haja uma nova estrutura de governança analítica que incorpore todas as probabilidades no processo de aprendizado de máquina – da criação de dados à preparação de dados e treinamento à inferência. Sem isso, pontuações de propensão erroneamente infladas irão diagnosticar pacientes, maltratar clientes e enganar empresas e governos enquanto tomam decisões críticas.

Next 4 pontos-chave para alavancar sua estratégia digital »

Previous « 8 cursos para profissionais de TI autônomos

UE ordena que Meta reabra WhatsApp a chatbots rivais

A Comissão Europeia determinou que a Meta reestabeleça o acesso de assistentes de inteligência artificial…

9 horas ago

Notícias

IPO da SpaceX chega ao mercado como aposta de US$ 1,75 trilhão em IA, não em foguetes

As negociações com as ações da SpaceX têm início nesta quinta-feira, 12, em uma oferta…

10 horas ago

Notícias

IA muda jornada de compra e devolve relevância aos sites de avaliação B2B, diz Forrester

A ascensão dos agentes de inteligência artificial (IA) está criando uma oportunidade para plataformas de…

10 horas ago

Notícias

Prêmio Executivo de TI do Ano 2026: conheça os critérios de avaliação

Continuam abertas as inscrições para o prêmio Executivo de TI do Ano 2026. A iniciativa,…

11 horas ago

Notícias

Meta cria programa de formação para técnicos de data centers em meio à expansão da infraestrutura de IA

A Meta anunciou um investimento de US$ 115 milhões para criar um programa de capacitação…

11 horas ago

Notícias

Apple apresenta nova geração do Siri AI e amplia aposta em inteligência artificial na WWDC 2026

A Apple utilizou a edição de 2026 da Worldwide Developers Conference (WWDC) para apresentar uma…

12 horas ago