Notícias

Hadoop: Nove fornecedores que você deveria conhecer

Antes reservado apenas aos grandes impérios da internet, como Google e
Yahoo, o Hadoop, o mais conhecido e popular sistema para gestão de Big Data,
começa agora a ser o queridinho das corporações

Há duas grandes razões para isso: as empresas têm muito mais dados para
gerenciar e Hadoop é uma grande plataforma, especialmente por permitir combinar
dados antigos do legado com novos dados não estruturados; um grande número de
empresas do mercado está entrando no jogo oferecendo serviços e suporte em
torno do Hadoop, tornando-o portanto mais palatável para as corporações.

Acrescente a isso o fato de que muitas empresas estimam que estão analisando
no máximo 12% de todos os dados que possuem, deixando os outros 88% na mesa, sem
aproveitamento, segundo o estudo “The Forrester Wave: Big Data Hadoop
Solutions, Q1 2014.”

“A Forrester acredita que o Hadoop é uma plataforma que precisa ser usada em
grandes empresas, formando a pedra angular de qualquer futura plataforma flexível
de gestão de dados. Se você tem dados estruturados, não estruturados e
binários, há espaço relevante para o Hadoop na sua empresa”, escrevem os
analistas Mike Gualtieri e Noel Yuhanna, autores do estudo.

O Hadoop é um projeto open source cujos principais componentes podem ser
baixados gratuitamente por qualquer pessoa. Várias empresas, da IBM à Amazon
Web Services, passando por Microsoft e Teradata, trataram empacotar o Hadoop em
serviços ou pacotes de consumo mais simples. Cada companhia assumiu uma
estratégia ligeiramente diferente, mas o elemento comum é o Hadoop ter a
habilidade de distribuir carga de trabalho potencialmente para centenas de
servidores, tornando o Big Data gerenciável.

Realizado no primeiro trimestre de 2014, o estudo da Forrester olhou nove
empresas e concluiu que não há ainda um líder claro de mercado nesse momento.

A lista de empresas que você vai ver a seguir foi elaborada pela Forrester
Wave e, portanto, não representa a totalidade das plataformas e do mercado de
gestão de Big Data. Pra evitar conflitos, alinhamos as empresas em ordem
alfabética.

Amazon Web Services (AWS)
Clientes procurando por plataforma Hadoop em nuvem pública podem recorrer à
empresa, que a Forrester chama de “King of the cloud”. O produto Hadoop da AWS
chama-se Elastic Map Reduce (EMR). Não é um Hadoop open source puro, já que foi
ajustado para rodar unicamente na nuvem da Amazon.

A Forrester diz que o EMR tem hoje a maior adoção entre as plataformas
Hadoop disponíveis no mercado. A AWS vai lançar um suporte mais robusto para o
EMR para outros produtos e serviços, incluindo o RedShift, para data warehouse
e o recém-lançado motor de processamento em tempo real Kenesis. E deverá
incluir suporte adicional para bases de dados NoSQL e ferramentas de BI.

O Hadoop da AWS é exclusivo da nuvem.

Cloudera
A Cloudera tem uma distribuição Hadoop open source que usa muitos aspectos do
projeto original  Apache mas que agrega
um grande número de melhorias, entre elas uma ferramenta de gestão e monitoramento
chamada Cloudera Manager e um motor SQL para rodar dados relacionais no Hadoop,
batizado de Impala.

A empresa usa o Hadoop como a base da sua distribuição, mas não é um produto
open source puro. “A estratégia da Cloudera é manter a lealdade ao núcleo do
Hadoop mas inovar com agressividade e velocidade para atender as demandas dos
consumidores e diferenciar sua solução dos seus concorrentes”, diz a Forrester.

O resultado, segundo o relatório, é uma adoção firme da plataforma da
Cloudera, que inclui uma lista de 200 clientes, alguns dos quais gerenciando mais
de 1 petabyte de dados.

Hortonworks
Como a Cloudera, a Hortonworks é uma empresa Hadoop pure-play. E, diferente da
Cloudera, a Hortonworks tem a distribuição de Hadoop mais próxima do código
open source original, talvez mais do que qualquer outro concorrente.

A meta da Hortonworks é construir um ecossistema Hadoop e evoluir o código
open source. Ela diz que isso beneficia os usuários porque evita que fiquem
presos a um fornecedor (se um cliente da Hortonworks quiser deixar sua
plataforma, poderá facilmente portar as aplicações para o código open source).

A postura da Hortonworks acabou garantindo parcerias fortes com fornecedores
de peso como Teradata, Microsoft, Red Hat e SAP.

IBM
Quando as corporações pensam em grandes projetos de TI, muitas pensam na IBM, e
com razão. Por causa disso, a IBM tornou-se um grande player no mundo Hadoop.

Segundo a Forrester, a IBM tem atualmente mais de 100 instalações de Hadoop,
com  muitos de seus clientes gerindo
petabytes de dados. A companhia tira vantagem da sua vasta experiência em
computação, data center e implementação de projetos de Big Data.

“O road map da IBM inclui continuar integrando a solução BigInsights Hadoop a
produtos como o analytics, gestão de carga de trabalho em computação de alta
performance, ferramentas de BI e ferramentas de modelagem e gestão de dados”, afirma
a Forrester.

Intel
Como a Amazon, a Intel está tirando vantagem e otimizando sua versão do Hadoop
para rodar no seu hardware – especificamente, 
processadores Xeon. Para clientes que procuram maior afinidade entre o
software e hardware, a distribuição de Hadoop da Intel é potencialmente a
solução ideal.

A Forrester ressalta que a Intel liberou recentemente seu produto, portanto
é esperado que a companhia inove um pouco mais sobre a versão atual.

MapR Technologies
MapR Technologies é talvez a companhia com a melhor distribuição de Hadoop
sobre a qual muitas pessoas nunca ouviram falar. Na pesquisa da Forrester com
usuários de Hadoop, a MapR recebeu a maior nota por sua oferta atual,  por conta da arquitetura e dos recursos de
processamento.

O tempero secreto da empresa é um conjunto de recursos únicos. O Hadoop da
MapR suporta Network File Systems (NFS) e a MapR o incluiu na sua plataforma
recursos de alto nível para recuperação de desastres e alta disponibilidade de
dados.

A Forrester diz que a MapR deve investir em marketing e mais parcerias para
ter o reconhecimento de marca que empresas como Cloudera e Hortonworks já
possuem no mercado.

Microsoft
A Microsoft está avançando não só em habilitar o Hadoop para rodar em Windows, como
em estar mais próxima de todo o ecossistema Hadoop. Os resultados do trabalho
podem ser vistos no produto HDInsight, da nuvem pública Windows Azure. Trata-se
de uma oferta de Hadoop como serviço baseada na distribuição da Hortonworks
feita especificamente para rodar no Azure.

“A presença significativa da Microsoft nos mercados de banco de dados, data
warehouse, cloud, OLAP, BI, planilhas, colaboração e ferramentas de
desenvolvimento, oferece uma vantagem”, diz a Forrester.

Pivotal Software
No ano passado, a EMC e a VMware combinaram um punhado de produtos de cada uma delas
para criar a Pivotal. Um dos grandes aspectos da nova empresa é trabalhar em
sua distribuição Hadoop junto com a Cloud Foundry PaaS.

Ao fazer isso, a Pivotal agregou algum ferramental sobre o código aberto,
especificamente um motor SQL chamado HAWQ e um appliance Hadoop feito
especificamente para Big Data.

Até agora, a empresa tem menos de 100 instalações ativas, a maioria entre
pequenas e médias empresas, diz a Forrester.

Teradata
Uma empresa como a Teradata poderia ver o Hadoop como uma ameaça ou uma
oportunidade. Para uma empresa especializada em gestão de dados – particularmente
no segmento de bancos de dados SQL e relacional – uma plataforma NoSQL como o
Hadoop poderia ser uma ameaça.

Em vez disso, a Teradata abraçou o Hadoop. Ao fazer uma parceria com a
Hortonworks, a Teradata agora oferece aos seus clientes a habilidade de usar a
plataforma integrada com suas ofertas SQL, dando aos clientes uma plataforma
Hadoop pronta para rodar, capaz de trabalhar sem empecilhos com dados já
armazenados em warehouses Teradata.

Recent Posts

SpaceX, Anthropic e OpenAI enfrentam riscos em possíveis IPOs

SpaceX, Anthropic e OpenAI estão no radar de Wall Street para possíveis aberturas de capital…

15 horas ago

Sistemas legados: como tomar decisões para garantir resiliência em setores críticos

por Eduardo Honorato Falar sobre infraestruturas críticas na Era Digital tem sua própria complexidade dentro…

18 horas ago

Sem equipes preparadas, IA não entrega transformação

A adoção de inteligência artificial (IA) nas empresas não depende apenas da disponibilidade de ferramentas.…

21 horas ago

Cohesity obtém patente para aplicar IA diretamente em dados de backup corporativos

A Cohesity anunciou a concessão da Patente Nº 12.619.501 pelo Escritório de Patentes e Marcas…

2 dias ago

Para Diogo Cortiz, maior desafio da IA é a falta de capacidade crítica para questionar suas respostas

Diogo Cortiz, professor da PUC-SP e doutor em Tecnologias da Inteligência e Design Digital, tem…

2 dias ago

Agentes de IA vão dar “superpoderes” a profissionais de TI, diz DJ Sampath, da Cisco

DJ Sampath chegou aos Estados Unidos há 30 anos com oito dólares no bolso e…

2 dias ago