Notícias

Alibaba lança modelo de IA que afirma superar o DeepSeek

A gigante chinesa de tecnologia Alibaba lançou nesta quarta-feira (29) uma nova versão de seu modelo de inteligência artificial (IA), o Qwen 2.5, afirmando que ele supera o amplamente elogiado DeepSeek-V3.

O momento incomum do lançamento do Qwen 2.5-Max, no primeiro dia do Ano Novo Lunar, quando a maioria dos chineses está descansando com suas famílias, aponta para a pressão gerada pelo crescimento meteórico da startup chinesa DeepSeek nas últimas três semanas. Esse crescimento impactou não apenas concorrentes internacionais, mas também rivais domésticos.

Leia também: Pesquisa indica que 49% das empresas estão reduzindo investimentos em IA, no Brasil

Alibaba desafia gigantes da IA

“O Qwen 2.5-Max supera… quase em todos os aspectos os modelos GPT-4o, DeepSeek-V3 e Llama-3.1-405B”, afirmou a unidade de computação em nuvem da Alibaba em um anúncio publicado em sua conta oficial no WeChat. A declaração faz referência aos modelos de IA mais avançados da OpenAI e da Meta.

A imprensa internacional tem falado que o lançamento do assistente de IA da DeepSeek em 10 de janeiro, alimentado pelo modelo DeepSeek-V3, seguido pelo lançamento do modelo R1 em 20 de janeiro, surpreendeu o Vale do Silício e causou queda nas ações de empresas de tecnologia. Os baixos custos de desenvolvimento e uso do DeepSeek levaram investidores a questionar os altos gastos planejados pelas principais empresas de IA dos Estados Unidos.

No entanto, o sucesso da DeepSeek também desencadeou uma corrida entre seus concorrentes domésticos para aprimorar seus próprios modelos de IA.

Dois dias após o lançamento do DeepSeek-R1, a ByteDance (dona do TikTok) lançou uma atualização do seu modelo de IA principal, afirmando que ele superava o modelo o1, da OpenAI, em AIME, um teste de referência que avalia a capacidade dos modelos de IA de compreender e responder a instruções complexas. Isso ecoou a declaração da DeepSeek de que seu modelo R1 rivalizava com o o1 da OpenAI em vários benchmarks de desempenho.

DeepSeek versus concorrência na China

O modelo DeepSeek-V2, antecessor do V3, já havia desencadeado uma guerra de preços de modelos de IA na China quando foi lançado em maio do ano passado.

O fato de o DeepSeek-V2 ser de código aberto e incrivelmente barato – custando apenas 1 yuan (US$ 0,14) por 1 milhão de tokens (unidades de dados processadas pelo modelo de IA) – levou a Alibaba Cloud a anunciar reduções de preços de até 97% em uma variedade de seus modelos.

Outras gigantes chinesas de tecnologia seguiram o mesmo caminho, incluindo a Baidu (9888.HK), que lançou o primeiro equivalente chinês ao ChatGPT em março de 2023, e a Tencent, a empresa de internet mais valiosa do país.

O enigmático fundador da DeepSeek, Liang Wenfeng, disse em uma rara entrevista ao portal chinês Waves, em julho, que a startup “não se importava” com guerras de preços e que seu principal objetivo era alcançar a Inteligência Artificial Geral (AGI).

A OpenAI define a AGI como sistemas autônomos que superam os humanos na maioria das tarefas economicamente valiosas.

Enquanto as grandes empresas chinesas de tecnologia, como a Alibaba, contam com centenas de milhares de funcionários, a DeepSeek opera como um laboratório de pesquisa, formado principalmente por jovens graduados e doutorandos das melhores universidades da China.

Na entrevista de julho, Liang afirmou que as maiores empresas de tecnologia da China podem não estar preparadas para o futuro da indústria de IA, contrastando seus altos custos e estruturas hierárquicas rígidas com a operação enxuta e a gestão flexível da DeepSeek.

Siga o IT Forum no LinkedIn e fique por dentro de todas as notícias!

Recent Posts

Propagandistas chineses usaram ChatGPT para gerar conteúdo contra tarifas de Trump e expansão de data centers nos EUA

A OpenAI divulgou na última quarta-feira um relatório revelando que propagandistas ligados à China utilizaram…

3 horas ago

Anthropic pede ao Congresso americano que preserve leis estaduais de IA na ausência de regulação federal robusta

A Anthropic enviou ao Congresso dos Estados Unidos, na última quarta-feira, uma série de recomendações…

4 horas ago

Leo conclui migração para SAP S/4HANA e acelera estratégia de digitalização

A Leo, maior revendedora de insumos para marcenaria do Brasil, finalizou a migração de seu…

5 horas ago

NTT Data cria AI Office no Brasil para acelerar a transformação empresarial com IA

A NTT Data criou um AI Office no Brasil, uma iniciativa estratégica para inovar no…

5 horas ago

IA reduz em 90% o tempo de transcrição de acervo histórico da Santa Casa de Porto Alegre

O Centro Histórico-Cultural da Santa Casa de Porto Alegre encontrou na inteligência artificial uma forma…

6 horas ago

LinkedIn chega a 100 milhões de usuários no Brasil e mira a era dos agentes de IA

O LinkedIn anunciou hoje (10), em evento para imprensa em São Paulo, a marca de…

7 horas ago