Cientistas alertam para o risco de colapso dos modelos de IA com dados gerados por máquinas

Estudo aponta que a proliferação de dados gerados por IA pode levar a um processo de deterioração na qualidade dos modelos de machine learning

Author Photo
2:33 pm - 29 de julho de 2024
Imagem: Shutterstock

Pesquisadores britânicos e canadenses levantaram um novo alerta na área de inteligência artificial sobre o fenômeno conhecido como “colapso dos modelos”. Um estudo liderado por Ilia Shumailov, da Universidade de Oxford, revela que esse problema surge quando modelos de IA são treinados com dados gerados por outras máquinas, o que pode levar a uma deterioração progressiva na qualidade das respostas que produzem.

Os pesquisadores explicam que os modelos de IA, que funcionam identificando padrões em dados de treinamento, tendem a gerar respostas baseadas nas saídas mais comuns encontradas. Isso é particularmente problemático quando a web está saturada de conteúdo gerado por IA, como imagens e textos, resultando em uma repetição excessiva de exemplos comuns.

Leia também: Golpes com IA: 5 dicas para não cair em deepfake

O estudo sugere que, ao continuar a treinar com dados gerados por outros modelos, a qualidade dos modelos pode se degradar progressivamente, tornando-os menos precisos e mais estranhos em suas respostas. O fenômeno pode levar a um colapso completo da eficácia do modelo, conforme os modelos se tornam cada vez mais distantes da realidade dos dados originais.

Os pesquisadores destacam que é crucial levar a sério o problema do colapso do modelo para manter os benefícios do treinamento com grandes volumes de dados extraídos da web.

Eles afirmam que o valor dos dados sobre interações humanas autênticas será cada vez mais significativo, especialmente diante da crescente presença de conteúdo gerado por modelos de linguagem. Além disso, eles alertam que pode se tornar progressivamente difícil treinar novas versões desses modelos sem acesso a dados que foram coletados antes da ampla adoção da tecnologia ou dados gerados diretamente por humanos em grande escala.

*Com informações do TechCrunch

Siga o IT Forum no LinkedIn e fique por dentro de todas as notícias! 

Author Photo
Redação

A redação contempla textos de caráter informativo produzidos pela equipe de jornalistas do IT Forum.

Author Photo

Newsletter de tecnologia para você

Os melhores conteúdos do IT Forum na sua caixa de entrada.