Categories: Notícias

Big Data x Relevant Data: explosão de dados migra para filtro de relevâncias

O termo Big Data é repetido à exaustão há pelo menos um ano e meio. Os desafios que as empresas e profissionais enfrentam com esse novo paradigma de análise de informação e inteligência de dados passam por formas mais eficazes de armazenamento, extração e boas ferramentas de analytics. Mas até quando isso será possível? Até quando é eficaz guardar toda essa informação? Seria o momento de parar de pensar em Big Data (grandes dados) e passarmos a considerar Relevant Data (dados relevantes)?

Assine a Newsletter do IT Web

Siga o IT Web no Twitter

Curta, no Facebook, a Fan Page do IT Web

Estamos falando em um mundo onde o recém atingido nível de armazenamento de dados zettabytte será suplantado pelo yottabytte, uma combinação numérica com 24 zeros em sua composição. Segundo perspectivas do SAS, o consumo de dados armazenados pelas corporações deve crescer 50 vezes até 2020, chegando a 44 zettabytes. A Symantec explicou que o nível de dados está em 2,2 zettabytes, com aumento de 63% sobre o ano anterior.

Parece existir uma ânsia  em torno do termo Big Data, e o medo que as companhias têm em perder dados relevantes cria um cenário onde armazenar, mesmo que sem critério ou um bom aparato de analíticos, parece ser melhor do que deixar o conteúdo de lado.

?Estamos aprendendo como acessar o valor dos dados agora. Tradicionalmente nós guardamos tudo, mas  isso está se tornando impossível?, ponderou, em entrevista ao IT Web, Joel Makower, fundador do GreenBiz. O executivo esteve no Brasil em outubro para mediar o Verge, rodada de discussão mundial sobre evolução da TI, Telecom e modelos de negócios em uma sociedade mais conectada. ?Vamos evoluir em termos de o que precisará ser guardado. Da mesma forma que estamos aprendendo a entender qual tipo de Big Data vamos ouvir?, continuou.

Quando se pensa em Big Data, o que vem à mente, em um primeiro momento, é a produção de conteúdo que a internet 3.0, mais colaborativa que suas gerações anteriores, permite atualmente. Contudo, o conceito é mais amplo. Quando se fala em cidades e prédios inteligentes, sob o conceito de internet das coisas, tudo passa a ter um endereço IP e a rastrear e emitir informações que podem, ou não, ser utilizadas para uma melhor interação da sociedade. O problema é quando o ?ou não? toma evidência no contexto da frase anterior, e um sensor emite infinitos dados que não servem para nada, somente para sobrecarregar as redes.

?Pense no futuro, um veículo elétrico em uma estrada inteligente. Serão cinco fluxos de dados diferentes: do veículo para a central, do veículo para a estrada, do veículo para a nuvem, do veículo para o motorista e do veículo para outros veículos, a fim de evitar colisão. Essa informação precisa ser usada em milésimos de segundos, se não perde valor?, exemplifica Makower. Depois disso, a maior parte dos dados vira lixo. Como é impossível para o ser humano lidar com tanta fonte de conteúdo, o papel da tecnologia machine to machine (M2M) é essencial.

Além disso, outro cenário deve ser considerado. ?Se pensarmos em um prédio inteligente, qualquer dispositivo ou tomada tem um endereço IP. Alguns deles podem mudar as informações uma vez por semana, outros ficam ali parados por vários dias. Mas algumas coisas mudam a cada segundo, como é o caso dos servidores. Se tratar todas as informações da mesma forma, não tem valor?, ponderou.

Segundo o especialista, a combinação desafio/oportunidade vem da decisão de qual dado deve ser ouvido e avaliado e em qual momento ele deve ser ignorado. ?Estamos começando a fazer essas perguntas e entender esses pontos?, considerou.

Gestão por contexto

Em entrevista exclusiva concedida à IT Web durante visita a São Paulo, o vice-presidente mundial de vendas e serviços da Symantec, Bill Robbins,  fez um paralelo da Data Warehouse das empresas com uma garagem, na qual a pessoa guarda todo tipo de objeto ? até mesmo tranqueiras ? por um período de 20 anos. Se depois de tanta coisa entulhada no local, ela quiser procurar um capacete de bicicleta, qual a garantia de que vai encontrar?

?É por isso que gestão de inteligência de dados é importante. Na Symantec falamos dos dados tendo contexto e relevância. De quem é o dado, quem está acessando, quem permite o acesso, quem criou, onde foi armazenado, qual o contexto? Esse dado é relevante? É uma informação ou é um dado que nunca foi usado??, exemplificou.

Com base nos critérios, fica mais fácil entender para qual local da rede corporativa  dado deve ser direcionado. Os menos usados vão para um storage menos disponível, com custo reduzido de manutenção. Os mais críticos, ficam na camada superior, para facilitar o acesso. ?Identificar contexto e relevância é muito importante?, finalizou.

 

Recent Posts

Empresas enfrentam lacuna crescente entre adoção de IA e segurança na nuvem

Existe uma lacuna crescente entre a rápida adoção da inteligência artificial (IA) e a capacidade…

1 hora ago

Segurança e adaptabilidade são os principais desafios do vibe coding, afirma especialista da Unicamp

Em tempos de inteligência artificial (IA) e de desenvolvimento via vibe coding, o professor do…

1 hora ago

Brasil fica entre as 10 piores federações em desempenho digital na Copa do Mundo, aponta Dynatrace

Vista não só como a maior Copa do Mundo história como também a mais digital,…

2 horas ago

IA da Anthropic simula 100 mil cenários da Copa e aponta a Holanda como maior ameaça ao Brasil

A simulação foi executada na terça-feira, 9 de junho, um dia depois do lançamento do…

3 horas ago

Resiliência e criatividade atuam na globalização do DNA brasileiro em tecnologia

por Thaís Trapp O Brasil formou profissionais moldados pela diversidade, pela complexidade e pela necessidade…

6 horas ago

Startup brasileira vence prêmio do MIT com IA que detecta risco de câncer em hemograma

A Huna, startup brasileira de inteligência artificial aplicada à saúde, venceu o MIT Solve Future…

6 horas ago