Computerworld Brasil

Nvidia anuncia serviço em nuvem para empresas criarem modelos de IA generativa

A Nvidia anunciou nesta terça-feira (21) um conjunto de serviços em nuvem que permite que empresas construam, refinem e operem seus próprios modelos amplos de linguagem (LLMs) personalizados. Com isso, a companhia espera acelerar a adoção de inteligência artificial (IA) generativa por empresas de diferentes tamanhos.

O conjunto de serviços inclui Nvidia AI Foundations. A oferta engloba o NeMo, de modelos de linguagem, e Picasso, para imagens, vídeos e de modelos 3D. Com eles, empresas poderão construir aplicações proprietárias de domínio específico, modelos de IA generativa para bate-papo inteligente, suporte ao cliente, simulação digital e outras aplicações.

Separadamente, a companhia também fornecerá o serviço em nuvem da BioNeM, com novos novos modelos para pesquisa e desenvolvimento em biologia.

“A IA generativa está impulsionando a rápida adoção da IA e reinventando inúmeras indústrias”, pontuou Jensen Huang, fundador e CEO da Nvidia, na abertura do GTC 2023. “O Nvidia AI Foundation permite às empresas personalizar os modelos de fundação com seus próprios dados para gerar os recursos mais valiosos da humanidade – inteligência e criatividade”.

Os serviços NeMo e Picasso são executados no DGX Cloud, novo serviço de supercomputação de IA que oferece às empresas acesso imediato à infraestrutura e ao software necessários para treinar modelos avançados para IA generativa e outros aplicativos inovadores.

Leia também: TI corporativa avança – com cautela – com IA generativa

“A Nvidia leva todo o expertise dela da parte de supercomputadores, da família DGX – que é o appliance de inteligência artificial da Nvidia –, para a nuvem”, explicou Marcel Saraiva, gerente de vendas enterprise da companhia no Brasil. “Com isso, a gente consegue ter a facilidade, segurança e dinâmica e a forma de trabalhar na nuvem com supercomputadores.”

O DGX Cloud é acessível através de um navegador de internet. Desenvolvedores podem utilizar os modelos oferecidos em cada serviço por meio de interfaces simples de programação de aplicações (APIs). Uma vez que os modelos estejam prontos para implementação, as empresas podem executar cargas de trabalho de inferência em escala usando os serviços em nuvem da AI Foundations.

Leia mais: Google avança IA generativa com novos recursos para devs

Cada serviço em nuvem inclui seis elementos: modelos pré-treinados, estruturas para processamento de dados, bancos de dados vetoriais e personalização, motores de inferência otimizados, APIs e suporte de especialistas da organização para ajudar clientes a afinar modelos para seus casos de uso personalizados.

Algumas empresas já estão construindo modelos customizados usando a DXG Cloud e suas ferramentas. A lista inclui a AMGen, que está utilizando a infraestrutura para pesquisa de medicamentos; a ServiceNow, que está pesquisando geração de códigos através de LLMs; e a CCC, que está empregando IA para agilizar o processamento de seguros.

“Estamos no ‘momento do iPhone da IA’. As startups estão correndo para criar produtos e modelos de negócios disruptivos, e as empresas estabelecidas estão procurando responder”, disse Huang. “O DGX Cloud oferece aos clientes acesso instantâneo à supercomputação da Nvidia AI em nuvens de escala global.”

Disponibilidade

Segundo a empresa, o serviço de IA generativa NeMo na nuvem está em acesso antecipado. O serviço Picasso está em pré-visualização privada. Desenvolvedores podem solicitar o acesso a cada um deles através de suas páginas oficiais.

Para o DGX Cloud, a companhia promete parcerias com os principais provedores de serviços em nuvem para hospedar a infraestrutura DGX Cloud. A primeira será a Oracle Cloud Infrastructure (OCI). A Microsoft Azure comece a hospedar o DGX Cloud no próximo trimestre, e o serviço será expandido “em breve” para o Google Cloud e mais.

Recent Posts

SpaceX, Anthropic e OpenAI enfrentam riscos em possíveis IPOs

SpaceX, Anthropic e OpenAI estão no radar de Wall Street para possíveis aberturas de capital…

1 hora ago

Sistemas legados: como tomar decisões para garantir resiliência em setores críticos

por Eduardo Honorato Falar sobre infraestruturas críticas na Era Digital tem sua própria complexidade dentro…

5 horas ago

Sem equipes preparadas, IA não entrega transformação

A adoção de inteligência artificial (IA) nas empresas não depende apenas da disponibilidade de ferramentas.…

7 horas ago

Cohesity obtém patente para aplicar IA diretamente em dados de backup corporativos

A Cohesity anunciou a concessão da Patente Nº 12.619.501 pelo Escritório de Patentes e Marcas…

1 dia ago

Para Diogo Cortiz, maior desafio da IA é a falta de capacidade crítica para questionar suas respostas

Diogo Cortiz, professor da PUC-SP e doutor em Tecnologias da Inteligência e Design Digital, tem…

1 dia ago

Agentes de IA vão dar “superpoderes” a profissionais de TI, diz DJ Sampath, da Cisco

DJ Sampath chegou aos Estados Unidos há 30 anos com oito dólares no bolso e…

1 dia ago