Google apresenta serviço de análise Big Data, o BigQuery

Author Photo
12:06 pm - 03 de maio de 2012

O Google lançou seu serviço de Big Data, o BigQuery, formalmente na terça-feira (01/05). A novidade promete ?analisar os terabytes de dados com apenas um clique?. O serviço,  baseado em cloud compunting e que teve a preview apresentada em março, combina o armazenamento de dados NoSQL com os recursos de pesquisa SQL.

A solução é voltada para análise interativa de grandes conjuntos de dados. O Google falou que o BigQuery não é uma base de dados, e é contrastada com a solução de hospedagem em nuvem, o serviço Google Cloud SQL baseado em MySQL.

Como sistemas NoSQL, o BigQuery não usa esquemas fixos; o Google disse que os dados normalmente são adicionados usando um pequeno número de grandes dimensões, que serão arquivos de tabelas Append Only (que são gravados apenas em modo incrementais e não podem ser removidos e renomeados. Além disso, novos links não são criados para estes arquivos). O serviço suporta consultas ad-hoc, relatórios, exploração de dados, ou até mesmo aplicativos baseados na Web que funcionam contra esses conjuntos de vários terabytes de dados. Os usuários interagem com o serviço através de uma ferramenta navegador BigQuery, uma ferramenta de linha de comando, ou através de chamadas para uma API baseada em RestT usando Java, Python, ou outras línguas.

Publicidade

A principal utilização do serviço é provável que seja a análise de dados de publicidade do Google, que já reside na nuvem da companhia. “Quando um anunciante quer entender o ROI [retorno sobre investimento] ou a eficácia de uma campanha de palavra-chave em execução em todo o mundo, tem um grande problema de Big Data”, afirmou Ju-Kay Kwek, gerente de produto da equipe Cloud Platform,durante um preview público do BigQuery em março.

Os clientes do Google Adwords normalmente extraem dados do serviço com API do AdWords, a fim de construir no local bancos de dados para análise posterior. Mas esses bancos de dados muitas vezes se tornam de difícil controle, exigindo sharding (ou uma partição horizontal em um motor de banco de dados ou de pesquisa) complexo, já que as etapas de indexação são organizadas de tal forma que “os clientes às vezes perdem a noção das questões que eles queriam perguntar por causa do tempo que o dado fica disponível “, disse Kwek.

Os clientes também poderão fazer upload de seus próprios dados no BigQuery, e o Google contará com uma variedade de usos para desenvolvedores externos. Usuários beta do serviço assumiram desafios como a segmentação ad Web e e-commerce. O fornecedor de inteligência de negócios francês We Are Cloud testou o BigQuery como uma alta escala de armazenamento de dados, infraestrutura para sua própria consulta, análise e visualização de dados de capacidades. A empresa diz que a tecnologia irá liberar seus clientes da árdua tarefa de executar uma grande plataforma, apoiando consulta rápida e análise de dezenas de terabytes de dados.

Atrair grandes clientes de dados certamente reforça o negócio de armazenamento online do Google, que só tem um grande tiro para conseguir isso por meio do lançamento do Google Drive, na última semana. O armazenamento de dados no serviço BigQuery vai custar US$ 0,12 por gigabyte por mês para até dois terabytes, com custos decrescentes acima desse volume. A análise BigQuery  custa US$ 0,35 por gigabyte de dados processados.

Saiba mais:

Google Drive é lançado com 5 GB grátis e até 1 TB por US$ 50

Google Drive pode ter 5GB de armazenamento gratuito

Google deve lançar cloud que armazena até 1 GB de graça

 

Newsletter de tecnologia para você

Os melhores conteúdos do IT Forum na sua caixa de entrada.