Microsoft anuncia novo supercomputador na nuvem para avançar inteligência artificial
Hospedado na Microsoft Azure, supercomputador foi desenhado para treinar modelos de inteligência artificial da OpenAI
A Microsoft anunciou nesta terça-feira (19) a disponibilidade de seu supercomputador na Microsoft Azure, infraestrutura de nuvem da companhia. O lançamento foi criado em colaboração com a OpenAI e será utilizado exclusivamente para treinar os modelos de inteligência artificial da instituição de pesquisa.
O anúncio inaugura uma nova fase na parceria com a OpenAI, iniciada no ano passado, para criar novas tecnologias de supercomputação na Azure. A novidade se dá enquanto a gigante de tecnologia realiza a conferência anual Microsoft Build, voltada à comunidade de desenvolvedores. Neste ano, devido à pandemia de covid-19, o evento é feito de forma digital.
Segundo a Microsoft, a ação conjunta com a OpenAI também marca o próximo passo para treinar modelos de IA muito grandes e a infraestrutura necessária para suportá-los. Essa combinação, enquanto plataforma, beneficiará outras empresas e desenvolvedores que se debruçarem sobre a inteligência artificial.
Um dos TOP 5 do mundo – O supercomputador desenvolvido para a OpenAI, explica a Microsoft, é um sistema único com mais de 285 mil núcleos de CPU, 10 mil GPUs e 400 gigabits por segundo de conectividade de rede para cada servidor GPU. Esse aparato todo dá à Microsoft um lugar cativo entre os cinco supercomputadores mais potentes da lista TOP500. “Hospedado na Azure, o supercomputador também se beneficia de todos os recursos de uma infraestrutura de nuvem moderna e robusta, incluindo implantação rápida, datacenters sustentáveis e acesso aos serviços da Azure”, diz a empresa.
Em comunicado, o CTO da Microsoft, Kevin Scott, diz que essas novas capacidades computacionais permitirão a criação de uma nova geração de soluções e avanços tecnológicos.
“Trata-se de ser capaz de fazer centenas de coisas interessantes no processamento de linguagem natural de uma só vez e centenas de coisas interessantes na visão computacional, e quando você começar a ver combinações desses domínios perceptivos, terá novos aplicativos difíceis imaginar até agora”, destacou.
Decifrando modelos de IA
Jennifer Langston, que escreve sobre pesquisa e inovação para o blog corporativo da Microsoft, explica que, historicamente, os especialistas em machine learning construíram modelos de IA menores e separados que usam muitos exemplos rotulados para aprender uma única tarefa. Entre os exemplos – tradução entre idiomas, reconhecimento de objetos ou fala para tarefas simples.
Entretanto, uma nova classe de modelos desenvolvidos pela comunidade de pesquisa em IA provou que algumas dessas tarefas podem ser realizadas melhor por um único modelo maciço – um que aprende ao examinar bilhões de páginas de texto publicamente disponível. Isso é importante, pois esse tipo de modelo se mostra melhor quando cientistas buscam, por exemplo, nuances da linguagem e contexto.
“À medida que aprendemos cada vez mais sobre o que precisamos e os diferentes limites de todos os componentes que compõem um supercomputador, fomos capazes de dizer: ‘Se pudéssemos projetar nosso sistema de sonhos, como seria?’”, questionou o CEO da OpenAI, Sam Altman para responder que a Microsoft conseguiu construí-lo.
Segundo Altman, objetivo da OpenAI, além de buscar avanços na pesquisa, visa também projetar e desenvolver tecnologias poderosas de IA que outras pessoas possam usar. O supercomputador desenvolvido em parceria com a Microsoft foi projetado para acelerar esse ciclo. “Estamos vendo que sistemas de larga escala são um componente importante no treinamento de modelos mais poderosos”, completou.
A Microsoft lembra que para os clientes que buscam acelerar seus projetos de IA, mas não precisam de um supercomputador dedicado, a oferta Azure AI fornece acesso ao poder computacional com o mesmo conjunto de aceleradores e redes de IA que alimentam o supercomputador.
A companhia afirma ainda que está disponibilizando as ferramentas para treinar grandes modelos de IA nesses clusters de maneira distribuída e otimizada.