IBM libera tecnologia Watson, mas programa ainda não fala português
O Watson Engagement Advisor funciona muito bem, mas em inglês. Trabalho agora é fazê-lo compreender outros idiomas

Você já leu aqui que dois anos após sua vitória no programa norte-americano Jeopardy!, o Watson começou a ser utilizado em diversos segmentos de mercado. Especialmente, nas áreas de saúde (na ajuda ao diagnóstico) e desde o início deste ano também nas áreas de atendimento ao cliente, marketing e vendas.
O que você não sabe é que muitas das vantagens do uso de sistemas de computação cognitiva, que permite às empresas processarem grandes volumes de dados em tempo recorde, proporcionando melhores interações com os clientes depende muito das equipes de desenvolvimento.
Entender pequenos detalhes da linguagem humana, processar perguntas de forma similar ao modo como as pessoas pensam e rapidamente analisar amplas quantidades de dados _muitos deles não estruturados _ identificando respostas relevantes e baseadas em evidências, como já faz o Watson através do recém anunciados projetos Watson Engagement Advisor e Ask Watson, requer a construção de um poderoso interpretador semântico (em português) e de um corpus de conhecimento (base de dados e informações, específico para cada língua).
O Watson que ganhou o Jeopardy! tem a estrutura semântica do inglês americano. Outras arquiteturas semânticas precisarão ser criadas para que o Watson seja usado em outros países. É por isso que você, CIO brasileiro, ainda não pode adquirir um Watson para a sua empresa. Nem mesmo esses dois novos projetos da IBM, já em funcionamento nos Estados Unidos.
A IBM está fazendo a parte dela para transformar a computação cognitiva em um sistema funcional, através do Watson. O programa Engagement Advisor funciona por meio da nuvem e de sessões de chat online e é capaz de capacitar o pessoal de atendimento ao cliente das empresas a oferecerem respostas rápidas e personalizadas. E está disponível para uso direto pelos clientes através de plataformas móveis equipadas com o APP Ask Watson. Nos dois casos, o Watson está focado em um determinado campo semântico.
O que precisamos?
No Brasil, algumas universidades, como é o caso da USP (na escolar Politécnica), já têm recursos humanos discutindo os conceitos de computação cognitiva, com base na inteligência artificial. “Mas vamos precisar de profissionais capazes de absorver esta tecnologia”, diz Fábio Gandour, cientista chefe da IBM Brasil.
Hoje o corpus de conhecimento do Watson está em inglês. Para usá-lo, é preciso ao menos que a interface em linguagem natural (em português) converse com o interpretador semântico (também em português, dotado de um tradutor automático) e ele possa interagir com um banco de conhecimento (em inglês). No futuro, o ideal é que o corpus de conhecimento esteja construído em português.
Por onde começar? Um bom caminho é pelo Apache. O Apache tem aplicativo de UIMA que tem que ser customizado com as regras de processamento semântico em português. É um bom ponto de partida, segundo Gandour. É no UIMA que nasce a computação cognitiva, que nasce o engenho de interpretação semântica sem o qual a computação cognitiva não existe”, afirma o cientista da IBM. A própria IBM já tem gente trabalhando nisso.
Outra é começar a se estruturar para lidar com o BIG Data. Toda essa informação pode se transformar em conhecimento útil através de modelos matemáticos sofisticados, também conhecidos como analytics. O passo seguinte é trabalhar esses dados através da computação cognitiva.
“O Watson
está no degrau de cima. O Big Data está
no degrau de baixa. Do que estamos falando? De tentar validar as conclusões do Big Data com a computação cognitiva”, explica Gandour. Trabalhar com Big Data ajudará a construir o banco de conhecimento com o qual a computação cognitiva irá trabalhar.
A IBM vai disponibilizar a tecnologia do Watson para a criação de um ecossistema que queira desenvolver aplicações em cima dela, através de um toolkit ou framework, assim como fez com o UIMA para o Apache.
Características técnicas
Segundo a IBM, o Watson não dispõe de nenhum hardware ou software especial. É baseada na tecnologia IBM Power 7 rodando em Linux, com chips de memória comuns e armazenamento de dados em discos padrão IBM DS8000. O que se pode destacar é a quantidade de processamento do Watson _ 90 servidores Power 750 configurados em cluster, cada um com 32 núcleos de processamento POWER7 operando a 3.55 GHz _ e, principalmente, uma memória RAM de 16 Terabytes. Isso tudo resultou em uma capacidade extraordinária de execução de 80 Teraflops (trilhões de operações por segundo) utilizada para o entendimento, pesquisa, recuperação, classificação e apresentação das informações.
O grande diferencial do Watson é o DeepQA, uma arquitetura de sistema probabilístico inventada pela IBM, que usa algoritmos de processamento analítico massivamente paralelos. Mais de cem técnicas diferentes foram usadas para analisar a linguagem natural, identificar as fontes de informação, gerar as hipóteses, achar e classificar as evidências e combinar e priorizar as respostas.
A maneira como essas técnicas foram combinadas no DeepQA trouxeram agilidade, precisão e clareza no encontro das respostas. E transformaram o Watson em um verdadeiro salto quântico na concepção, aplicação e desenvolvimento da Inteligência Artificial.
Mas, da mesma forma que a Inteligência Artificial não é uma panaceia, a computação cognitiva também não é. Não serve para tudo, ainda E precisa de mão de obra especializada para ser funcional. Depende diretamente da qualidade dos dados que temos e das perguntas que faremos.
A expectativa da IBM é a de que o Watson chegue ao Brasil com foco inicial em atendimento ao cliente e em serviços públicos. Além disso, a IBM pretende transformar a consulta a Watson um serviço acessível a todos, criando soluções que não demandem alto investimento tecnológico por parte do usuário, como é o caso do Watson Engagement Advisor e do Ask Watson (desde que o usuário domine o inglês americano, por enquanto). Especialmente em aplicações de Web semântica. A ver.
