Google promete Hadoop e Spark em 90 segundos por US$ 0,01

Cloud Dataproc usa um modelo de cobrança minuto a minuto, com um pacote de faturamento/contratação mínimo de 10 minutos

Author Photo
3:45 pm - 23 de setembro de 2015
aplicacao_nuvem_cloud.png

Extrair insights de big data, normalmente, não é uma tarefa nem fácil nem rápida. A Google quer mudar esse contexto com um novo serviço gerenciado focado em Hadoop e Spark. A gigante de buscas apresentou o Cloud Dataproc, uma solução aberta orientada a grandes volumes de dados e que permite às empresas criar, gerenciar e desligar rapidamente clusters.

“Muitas vezes, não é fácil para uma companhia instalar e operar essas tecnologias”, enfatiza Holger Mueller, vice-presidente e analista da Constellation Research. “Quando dois produtos de código aberto precisam ser combinados, as coisas tendem a ficar ainda mais complexas”, adiciona.

Uma maneira fácil de implementar e rodar clusters Hadoop e Spark pode trazer um valor significativo aos usuários. Assim, o analista avalia que a Cloud Dataproc significa que o mercado poderá experimentar a exploração de maiores volumes de carga e obter ganhos de escala, impulsionando o uso dos modelos.

A oferta traz algumas vantagens tanto sobre o modelo mais tradicional, promete a Google. A companhia afirma isso fazendo uma comparação: considerando que a criação de clusters Spark e Hadoop locais ou em Infrastructure-as-a-Service (IaaS) pode levar até 30 minutos, o novo serviço permite fazer isso em apenas 90 segundos – dando mais tempo para que os usuários passe a utilizar, de fato, os recursos e dados.

“Quando você faz a implantação com autogestão, seja no local ou na nuvem, está efetivamente gastando seu próprio tempo para os clusters”, cita Greg DeMichillie, diretor de gerenciamento de produto para o Google Cloud Platform. “O Dataproc permite que você encurte a janela entre fazer a pergunta e começar a receber os insights”.

O preço do serviço é US$ 0,01 por CPU em cada cluster por hora, e podem incluir instâncias preemptíveis – com custos de processamento computação ainda mais baixos. O serviço usa um modelo de cobrança minuto a minuto, com um pacote de faturamento/contratação mínimo de 10 minutos.

O Cloud Dataproc também oferece integração embutida com serviços de plataforma em nuvem do Google, como BigQuery, Cloud Storage, Bigtable, Logging e Monitoring. As empresas podem usar os recursos extrair, transformar e carregar terabytes de dados de registro cruas diretamente em BigQuery para gerar relatórios de negócios, por exemplo.

Por ser um serviço gerenciado, empresas podem usar os clusters de Hadoop e Spark sem a necessidade de assistência de um administrador ou software especial, garante a Google. Em vez disso, eles podem interagir com clusters através do Developers Console, do Cloud SDK ou do Dataproc REST API; assim, é possível desligar as ferramentas quando não estão em uso, evitando desperdício.

Newsletter de tecnologia para você

Os melhores conteúdos do IT Forum na sua caixa de entrada.