O Yahoo anunciou nessa quinta-feira (14/1) que está trabalhando para tornar a maior biblioteca de dados de machine learning do mundo disponível para a comunidade acadêmica para fins de pesquisa, por meio do seu programa Yahoo Labs Webscope.
Com 13,5 terabytes, a biblioteca é composta por dados de interação entre 20 milhões de usuários anônimos, coletados entre fevereiro de 2015 e maio do mesmo ano, incluindo aqueles que acessaram a homepage do Yahoo e de seus serviços, como Yahoo Notícias, Esportes, Finanças, e Imóveis.
Além disso, os dados possuem informações demográficas, como faixa etária e sexo, dados geográficos genéricos e frases-chave de artigos noticiosos, data e hora local, bem como informações parciais de dispositivos.
De acordo com a diretora de ciência da personalização do Yahoo Labs, Suju Rajan, dados são a força vital por trás da aprendizagem de machine learning, mas o acesso em grande escala à biblioteca “é um privilégio que tradicionalmente é reservado a pesquisadores da área e cientistas de dados que trabalham em grandes companhias – e fora do alcance da maioria dos pesquisadores acadêmicos”, disse. Esse cenário contribui para a demora nas pequisas, pode retardar a inovação e a evolução da tecnologia.
Pesquisadores da Carnegie Mellon University, a Universidade da Califórnia em San Diego; e do UMass Amherst Centro para Ciência de Dados já declararam que utilização a biblioteca para embasar estudos próprios.
Na Carnegie Mellon, por exemplo, os especialistas poderão estudar como identificar automaticamente quais notícias são de interesse e para quais usuários elas devem ser direcionadas, como conta Tom Mitchell, presidente do departamento de machine learning.
A ideia do Yahoo é nivelar o campo de pesquisa entre indústria e academia e a iniciativa pode tornar esse cenário viável.
Neil Redding será o palestrante de abertura do IT Forum Praia do Forte 2026. Com…
Apesar da consolidação da computação em nuvem como um dos pilares da transformação digital, uma…
As equipes de segurança cibernética enfrentarão um cenário cada vez mais complexo nos próximos anos,…
Apenas uma em cada três pessoas dos Estados Unidos aprova o ritmo acelerado de construção…
Desde o início do ano, a redação acompanha como a Copa do Mundo 2026 extrapola…
A NiCE anunciou a criação do NiCE Labs, um laboratório voltado ao desenvolvimento e à…