Notícias

DeepSeek lança modelo de IA com “atenção esparsa” que reduz custos de API em até 50%

A chinesa DeepSeek apresentou nesta segunda-feira (29) o V3.2-exp, modelo experimental de inteligência artificial que adota a técnica Sparse Attention, capaz de cortar pela metade os custos de inferência em operações de longo contexto. O anúncio foi feito na plataforma Hugging Face, acompanhado de artigo científico publicado no GitHub, segundo o TechCrunch.

O sistema combina dois módulos: o “lightning indexer”, que seleciona trechos relevantes da janela de contexto, e o “fine-grained token selection system”, que filtra tokens específicos dentro desses trechos. Essa estratégia permite ao modelo lidar com grandes volumes de informação sem sobrecarregar servidores.

Testes preliminares indicam que o custo de uma chamada simples de API pode cair até 50% em cenários de contexto extenso. Como o modelo é de código aberto, pesquisadores independentes poderão validar os resultados em breve.

Leia também: Digibee vive momento de virada na era dos agentes de IA

Contexto do avanço

A busca por eficiência no uso de modelos pré-treinados tem crescido, já que os custos de inferência, diferentes do custo de treinamento, se tornaram barreira para a escalabilidade de serviços de IA. O trabalho da DeepSeek mostra que ainda há espaço para otimizar a arquitetura transformer.

Fundada na China, a empresa ganhou notoriedade no início do ano com o modelo R1, treinado com uso intensivo de reinforcement learning a custos bem menores que concorrentes americanos. Embora não tenha causado a revolução esperada, a iniciativa posicionou a companhia como peça singular na corrida global da IA.

Siga o IT Forum no LinkedIn e fique por dentro de todas as notícias!

Recent Posts

Resiliência e criatividade atuam na globalização do DNA brasileiro em tecnologia

por Thaís Trapp O Brasil formou profissionais moldados pela diversidade, pela complexidade e pela necessidade…

30 minutos ago

Startup brasileira vence prêmio do MIT com IA que detecta risco de câncer em hemograma

A Huna, startup brasileira de inteligência artificial aplicada à saúde, venceu o MIT Solve Future…

55 minutos ago

Unico processa Serasa Experian por suposto uso indevido de tecnologia de biometria facial

A Unico, empresa brasileira especializada em identidade digital e biometria facial, ingressou com ações nas…

14 horas ago

Salesforce leva Agentforce à Copa do Mundo de 2026

A Salesforce anunciou parceria com a FIFA como apoiadora oficial da Copa do Mundo de…

14 horas ago

Neil Redding abre IT Forum Praia do Forte 2026 com debate sobre liderança na era da IA

Neil Redding será o palestrante de abertura do IT Forum Praia do Forte 2026. Com…

16 horas ago

47% das empresas brasileiras devem adiar migração para a nuvem nos próximos três anos

Apesar da consolidação da computação em nuvem como um dos pilares da transformação digital, uma…

16 horas ago