Explicação sobre queda de serviço da RIM ainda deixa dúvidas

Author Photo
10:49 am - 17 de outubro de 2011

Depois de quase quatro dias de queda de serviços do BlackBerry, da RIM, os coCEOs da empresa deram uma atualização do status na quinta-feira (13/10). Mike Lazaridis deu o que parecia ser um discurso ensaiado, fazendo surgir vários questionamentos na mídia e entre os consumidores.

A maneira que a RIM reagiu à queda irá provavelmente moldar o destino da empresa. E sobre a pergunta essencial – como irá ficar a qualidade e o aumento de sua rede – muitas das questões ficaram sem resposta.

Lazaridis iniciou com uma desculpa e algo como uma promessa. “Vocês esperavam mais da gente, eu tinha expectativas mais altas. Nós vamos – independentemente da ação – minimizar o risco de que algo assim volte a acontecer .

Aparentemente, a falha de um switch com um sistema saturado levou a um “efeito cascata”, que causou a queda mundial por dias.

A questão que muitos consumidores faziam era se a arquitetura é planejada corretamente e os testes ocorrem sempre, como isso foi possível.

Lazaridis respondeu que “a análise da causa” ainda está em curso. Em suas palavras “um core dual, redundante, de alta capacidade, projetado para proteger a infraestrutura do core, falhou”. Isso aparentemente causou as quedas e atrasos na Europa, Oriente Médio, África, Índia, Brasil, Chile e Argentina. “Isso provocou uma falha em cascata em nosso sistema. Há um switch backup, mas o backup não funcionou como previsto e isso levou a um acúmulo de dados no sistema. A queda na Europa deixou os sistemas sobrecarregados em outros lugares. Quando o sistema de base da Europa reiniciou, a fila de processos demorou mais do que o esperado”.

Isso levou a quedas de serviço em todos os outros lugares, incluindo o Brasil.

Lazaridis ressaltou que a RIM testa seus sistemas regularmente. Ele observou a carga de nível de serviço de 99,97% nos últimos 18 meses e prometeu que a empresa fará tudo a seu alcance para minimizar o risco de recorrência. Especificamente, a companhia irá trabalhar juntamente com o fornecedor para “corrigir a falha no switch que ocorreu na segunda-feira (10/10)”, auditar a infraestrutura e continuar a investigação.

Quando questionado sobre quais fornecedores estavam envolvidos, a organização foi cautelosa, afirmando que a empresa tem uma estrutura multifornecedora e que era muito cedo para abordar esse assunto.

Durante a coletiva, um analista perguntou como a queda na Europa podia ter levado ao efeito cascata ocorrido e, especificamente, se a RIM possuía somente dois centros operacionais. Jim Balsillie, co-CEO, tomou a palavra e respondeu que “aconteceu exatamente da forma que Mike havia descrito”. O que, é claro, não responde realmente à pergunta.

Outras questões levantadas durante a coletiva não eram respondidas de forma a passar confiança aos participantes.

Foi uma falha de hardware? “Nós não sabemos por que a falha ocorreu dessa maneira”, afirmou Lazaridis. A RIM pareceu clara sobre o fato de que a queda não foi precedida por mudanças no hardware ou software, mas não explicou nada além disso.

E, levando em conta as demissões que a empresa realizou recentemente, era natural que alguns ouvintes questionassem se a confiabilidade da infraestrutura havia sido comprometida pela partida de membros essenciais. Afinal de contas, quando  os melhores homens vão embora as coisas começam a falhar. A resposta a isso também foi “não”, mas “a equipe que gerencia as operações de emergência é altamente qualificada, isso não afetaria o sistema”, não é exatamente uma resposta retumbante frente às políticas de retenções que podem prevenir um êxodo em massa de engenheiros.

Os clientes da RIM sabem que a confiabilidade, as ferramentas de gerenciamento e a força de segurança são as características que a empresa pode oferecer agora. A RIM não pode competir em recursos.

Não há dúvidas de que mais informações virão nos próximos dias. Mas no momento, continua a existir sérias dúvidas sobre a arquitetura, os procedimentos de testes e outros aspectos do serviço venerável e outrora poderoso da empresa.

Tradução: Alba Milena, especial para o IT Web | Revisão: Thaís Sabatini

Acompanhe o caso:

RIM afirma que serviços do BlackBerry operam bem

BlackBerry enfreta terceiro dia de falhas de conectividade

ð        Você tem Twitter? Então, siga http://twitter.com/IT_Web e fique por dentro das principais notícias de TI e telecom


 

Newsletter de tecnologia para você

Os melhores conteúdos do IT Forum na sua caixa de entrada.