Notícias

Alibaba lança modelo de IA que afirma superar o DeepSeek

A gigante chinesa de tecnologia Alibaba lançou nesta quarta-feira (29) uma nova versão de seu modelo de inteligência artificial (IA), o Qwen 2.5, afirmando que ele supera o amplamente elogiado DeepSeek-V3.

O momento incomum do lançamento do Qwen 2.5-Max, no primeiro dia do Ano Novo Lunar, quando a maioria dos chineses está descansando com suas famílias, aponta para a pressão gerada pelo crescimento meteórico da startup chinesa DeepSeek nas últimas três semanas. Esse crescimento impactou não apenas concorrentes internacionais, mas também rivais domésticos.

Leia também: Pesquisa indica que 49% das empresas estão reduzindo investimentos em IA, no Brasil

Alibaba desafia gigantes da IA

“O Qwen 2.5-Max supera… quase em todos os aspectos os modelos GPT-4o, DeepSeek-V3 e Llama-3.1-405B”, afirmou a unidade de computação em nuvem da Alibaba em um anúncio publicado em sua conta oficial no WeChat. A declaração faz referência aos modelos de IA mais avançados da OpenAI e da Meta.

A imprensa internacional tem falado que o lançamento do assistente de IA da DeepSeek em 10 de janeiro, alimentado pelo modelo DeepSeek-V3, seguido pelo lançamento do modelo R1 em 20 de janeiro, surpreendeu o Vale do Silício e causou queda nas ações de empresas de tecnologia. Os baixos custos de desenvolvimento e uso do DeepSeek levaram investidores a questionar os altos gastos planejados pelas principais empresas de IA dos Estados Unidos.

No entanto, o sucesso da DeepSeek também desencadeou uma corrida entre seus concorrentes domésticos para aprimorar seus próprios modelos de IA.

Dois dias após o lançamento do DeepSeek-R1, a ByteDance (dona do TikTok) lançou uma atualização do seu modelo de IA principal, afirmando que ele superava o modelo o1, da OpenAI, em AIME, um teste de referência que avalia a capacidade dos modelos de IA de compreender e responder a instruções complexas. Isso ecoou a declaração da DeepSeek de que seu modelo R1 rivalizava com o o1 da OpenAI em vários benchmarks de desempenho.

DeepSeek versus concorrência na China

O modelo DeepSeek-V2, antecessor do V3, já havia desencadeado uma guerra de preços de modelos de IA na China quando foi lançado em maio do ano passado.

O fato de o DeepSeek-V2 ser de código aberto e incrivelmente barato – custando apenas 1 yuan (US$ 0,14) por 1 milhão de tokens (unidades de dados processadas pelo modelo de IA) – levou a Alibaba Cloud a anunciar reduções de preços de até 97% em uma variedade de seus modelos.

Outras gigantes chinesas de tecnologia seguiram o mesmo caminho, incluindo a Baidu (9888.HK), que lançou o primeiro equivalente chinês ao ChatGPT em março de 2023, e a Tencent, a empresa de internet mais valiosa do país.

O enigmático fundador da DeepSeek, Liang Wenfeng, disse em uma rara entrevista ao portal chinês Waves, em julho, que a startup “não se importava” com guerras de preços e que seu principal objetivo era alcançar a Inteligência Artificial Geral (AGI).

A OpenAI define a AGI como sistemas autônomos que superam os humanos na maioria das tarefas economicamente valiosas.

Enquanto as grandes empresas chinesas de tecnologia, como a Alibaba, contam com centenas de milhares de funcionários, a DeepSeek opera como um laboratório de pesquisa, formado principalmente por jovens graduados e doutorandos das melhores universidades da China.

Na entrevista de julho, Liang afirmou que as maiores empresas de tecnologia da China podem não estar preparadas para o futuro da indústria de IA, contrastando seus altos custos e estruturas hierárquicas rígidas com a operação enxuta e a gestão flexível da DeepSeek.

Siga o IT Forum no LinkedIn e fique por dentro de todas as notícias!

Recent Posts

Unico processa Serasa Experian por suposto uso indevido de tecnologia de biometria facial

A Unico, empresa brasileira especializada em identidade digital e biometria facial, ingressou com ações nas…

2 horas ago

Salesforce leva Agentforce à Copa do Mundo de 2026

A Salesforce anunciou parceria com a FIFA como apoiadora oficial da Copa do Mundo de…

3 horas ago

Neil Redding abre IT Forum Praia do Forte 2026 com debate sobre liderança na era da IA

Neil Redding será o palestrante de abertura do IT Forum Praia do Forte 2026. Com…

4 horas ago

47% das empresas brasileiras devem adiar migração para a nuvem nos próximos três anos

Apesar da consolidação da computação em nuvem como um dos pilares da transformação digital, uma…

4 horas ago

Deepfakes, IA e software open source lideram lista de ameaças críticas para empresas, diz Gartner

As equipes de segurança cibernética enfrentarão um cenário cada vez mais complexo nos próximos anos,…

6 horas ago

Apenas um em cada três americanos aprova a construção de data centers

Apenas uma em cada três pessoas dos Estados Unidos aprova o ritmo acelerado de construção…

7 horas ago