Categories: Notícias

Yahoo libera biblioteca de dados para comunidade acadêmica

O Yahoo anunciou nessa quinta-feira (14/1) que está trabalhando para tornar a maior biblioteca de dados de machine learning do mundo disponível para a comunidade acadêmica para fins de pesquisa, por meio do seu programa Yahoo Labs Webscope.

Com 13,5 terabytes, a biblioteca é composta por dados de interação entre 20 milhões de usuários anônimos, coletados entre fevereiro de 2015 e maio do mesmo ano, incluindo aqueles que acessaram a homepage do Yahoo e de seus serviços, como Yahoo Notícias, Esportes, Finanças, e Imóveis.

Além disso, os dados possuem informações demográficas, como faixa etária e sexo, dados geográficos genéricos e frases-chave de artigos noticiosos, data e hora local, bem como informações parciais de dispositivos.

De acordo com a diretora de ciência da personalização do Yahoo Labs, Suju Rajan, dados são a força vital por trás da aprendizagem de machine learning, mas o acesso em grande escala à biblioteca “é um privilégio que tradicionalmente é reservado a pesquisadores da área e cientistas de dados que trabalham em grandes companhias – e fora do alcance da maioria dos pesquisadores acadêmicos”, disse. Esse cenário contribui para a demora nas pequisas, pode retardar a inovação e a evolução da tecnologia.

Pesquisadores da Carnegie Mellon University, a Universidade da Califórnia em San Diego; e do UMass Amherst Centro para Ciência de Dados já declararam que utilização a biblioteca para embasar estudos próprios. 

Na Carnegie Mellon, por exemplo, os especialistas poderão estudar como identificar automaticamente quais notícias são de interesse e para quais usuários elas devem ser direcionadas, como conta Tom Mitchell, presidente do departamento de machine learning.

A ideia do Yahoo é nivelar o campo de pesquisa entre indústria e academia e a iniciativa pode tornar esse cenário viável.

Recent Posts

Unico processa Serasa Experian por suposto uso indevido de tecnologia de biometria facial

A Unico, empresa brasileira especializada em identidade digital e biometria facial, ingressou com ações nas…

11 horas ago

Salesforce leva Agentforce à Copa do Mundo de 2026

A Salesforce anunciou parceria com a FIFA como apoiadora oficial da Copa do Mundo de…

12 horas ago

Neil Redding abre IT Forum Praia do Forte 2026 com debate sobre liderança na era da IA

Neil Redding será o palestrante de abertura do IT Forum Praia do Forte 2026. Com…

13 horas ago

47% das empresas brasileiras devem adiar migração para a nuvem nos próximos três anos

Apesar da consolidação da computação em nuvem como um dos pilares da transformação digital, uma…

13 horas ago

Deepfakes, IA e software open source lideram lista de ameaças críticas para empresas, diz Gartner

As equipes de segurança cibernética enfrentarão um cenário cada vez mais complexo nos próximos anos,…

15 horas ago

Apenas um em cada três americanos aprova a construção de data centers

Apenas uma em cada três pessoas dos Estados Unidos aprova o ritmo acelerado de construção…

16 horas ago