Notícias

Novo modelo de rede neural pode tornar IA mais transparente

Um novo método de construção de redes neurais artificiais promete simplificar a interpretação do funcionamento da inteligência artificial (IA), segundo estudo conduzido por pesquisadores do MIT. O modelo, chamado Redes Kolmogorov-Arnold (KANs), altera a maneira como os neurônios artificiais processam informações, movendo parte da complexidade para fora das células neurais e tornando mais fácil entender as saídas produzidas por essas redes, segundo informações do MIT Technology Review.

Diferente das redes neurais tradicionais, usadas em modelos como o GPT-4, que dependem de operações matemáticas complexas dentro de cada neurônio, as KANs simplificam essa dinâmica. Nas novas redes, os neurônios somam suas entradas e geram uma saída direta, sem a necessidade de operações adicionais ocultas. A simplificação, que é inspirada no trabalho de matemáticos russos, promete facilitar a compreensão de como as redes chegam a determinados resultados, ajudando a detectar possíveis vieses.

Leia também: De outubro a outubro: o cronograma do conflito entre o X de Elon Musk e o STF

De acordo com os pesquisadores, a nova arquitetura também pode ser mais eficiente. Evidências preliminares sugerem que, à medida que as KANs são ampliadas, sua precisão cresce mais rapidamente em comparação às redes neurais tradicionais, o que pode ter grande impacto em áreas como reconhecimento de imagem e problemas de dinâmica de fluidos.

“É bom ver que as pessoas estão tentando repensar fundamentalmente o design dessas [redes]”, afirmou Andrew Wilson, da Universidade de Nova York, à MIT Technology Review.

As Redes Kolmogorov-Arnold, propostas nos anos 1990, ganharam nova relevância com o avanço promovido por uma equipe do MIT, que desenvolveu e testou redes maiores e mais interpretáveis. Ziming Liu, da equipe, destacou que essa inovação pode acabar com a visão das redes neurais como “caixas-pretas”.

O projeto, embora ainda inicial, já atrai interesse, com exemplos práticos no GitHub que demonstram o uso das KANs em aplicações como reconhecimento de imagens e solução de problemas complexos, como a dinâmica de fluidos.

Apesar do otimismo, a equipe do MIT ressalta que o novo método ainda está em fase experimental e foi testado apenas em pequenos conjuntos de dados sintéticos. Desafios como a aplicabilidade em problemas mais complexos, como reconhecimento de imagem em larga escala, ainda precisam ser superados. Além disso, a publicação também destaca que o treinamento das KANs exige mais tempo e poder computacional em comparação às redes tradicionais.

Siga o IT Forum no LinkedIn e fique por dentro de todas as notícias!

Recent Posts

Unico processa Serasa Experian por suposto uso indevido de tecnologia de biometria facial

A Unico, empresa brasileira especializada em identidade digital e biometria facial, ingressou com ações nas…

1 hora ago

Salesforce leva Agentforce à Copa do Mundo de 2026

A Salesforce anunciou parceria com a FIFA como apoiadora oficial da Copa do Mundo de…

2 horas ago

Neil Redding abre IT Forum Praia do Forte 2026 com debate sobre liderança na era da IA

Neil Redding será o palestrante de abertura do IT Forum Praia do Forte 2026. Com…

3 horas ago

47% das empresas brasileiras devem adiar migração para a nuvem nos próximos três anos

Apesar da consolidação da computação em nuvem como um dos pilares da transformação digital, uma…

3 horas ago

Deepfakes, IA e software open source lideram lista de ameaças críticas para empresas, diz Gartner

As equipes de segurança cibernética enfrentarão um cenário cada vez mais complexo nos próximos anos,…

5 horas ago

Apenas um em cada três americanos aprova a construção de data centers

Apenas uma em cada três pessoas dos Estados Unidos aprova o ritmo acelerado de construção…

6 horas ago