Notícias

Google promete Hadoop e Spark em 90 segundos por US$ 0,01

Extrair insights de big data, normalmente, não é uma tarefa nem fácil nem rápida. A Google quer mudar esse contexto com um novo serviço gerenciado focado em Hadoop e Spark. A gigante de buscas apresentou o Cloud Dataproc, uma solução aberta orientada a grandes volumes de dados e que permite às empresas criar, gerenciar e desligar rapidamente clusters.

“Muitas vezes, não é fácil para uma companhia instalar e operar essas tecnologias”, enfatiza Holger Mueller, vice-presidente e analista da Constellation Research. “Quando dois produtos de código aberto precisam ser combinados, as coisas tendem a ficar ainda mais complexas”, adiciona.

Uma maneira fácil de implementar e rodar clusters Hadoop e Spark pode trazer um valor significativo aos usuários. Assim, o analista avalia que a Cloud Dataproc significa que o mercado poderá experimentar a exploração de maiores volumes de carga e obter ganhos de escala, impulsionando o uso dos modelos.

A oferta traz algumas vantagens tanto sobre o modelo mais tradicional, promete a Google. A companhia afirma isso fazendo uma comparação: considerando que a criação de clusters Spark e Hadoop locais ou em Infrastructure-as-a-Service (IaaS) pode levar até 30 minutos, o novo serviço permite fazer isso em apenas 90 segundos – dando mais tempo para que os usuários passe a utilizar, de fato, os recursos e dados.

“Quando você faz a implantação com autogestão, seja no local ou na nuvem, está efetivamente gastando seu próprio tempo para os clusters”, cita Greg DeMichillie, diretor de gerenciamento de produto para o Google Cloud Platform. “O Dataproc permite que você encurte a janela entre fazer a pergunta e começar a receber os insights”.

O preço do serviço é US$ 0,01 por CPU em cada cluster por hora, e podem incluir instâncias preemptíveis – com custos de processamento computação ainda mais baixos. O serviço usa um modelo de cobrança minuto a minuto, com um pacote de faturamento/contratação mínimo de 10 minutos.

O Cloud Dataproc também oferece integração embutida com serviços de plataforma em nuvem do Google, como BigQuery, Cloud Storage, Bigtable, Logging e Monitoring. As empresas podem usar os recursos extrair, transformar e carregar terabytes de dados de registro cruas diretamente em BigQuery para gerar relatórios de negócios, por exemplo.

Por ser um serviço gerenciado, empresas podem usar os clusters de Hadoop e Spark sem a necessidade de assistência de um administrador ou software especial, garante a Google. Em vez disso, eles podem interagir com clusters através do Developers Console, do Cloud SDK ou do Dataproc REST API; assim, é possível desligar as ferramentas quando não estão em uso, evitando desperdício.

Recent Posts

Roubo de identidade é problema para 55% dos CISOs

Um estudo feito pela Netwrix e publicado pela Aiqon descobriu que os roubos de identidade…

7 horas ago

Cisco e Senac ampliam parceria para levar cursos de tecnologia e conectividade para comunidades do Amazonas

O Senac, em parceria com a Cisco, lança hoje (29) a 1ª Academia Fluvial do Cisco…

9 horas ago

Multicloud híbrida deve crescer 12 vezes em até três anos no Brasil

Os líderes brasileiros têm a expectativa de aumentar em 12 vezes a adoção de multicloud…

10 horas ago

Anthropic contrata Jan Leike, ex-OpenAI, para liderar nova equipe de superalinhamento

Após sua saída da OpenAI em meados de maio, Jan Leike, pesquisador de Inteligência Artificial,…

10 horas ago

PayPal anuncia nova divisão de publicidade baseada em dados de usuários

O PayPal está entrando no mercado de publicidade com uma nova divisão, utilizando dados de…

11 horas ago

Crescimento é prioridade de CEOs para 2024, superando tecnologia

Mais de seis em cada dez (62%) dos CEOs tem o crescimento de suas organizações…

12 horas ago