Categories: Notícias

Yahoo libera biblioteca de dados para comunidade acadêmica

O Yahoo anunciou nessa quinta-feira (14/1) que está trabalhando para tornar a maior biblioteca de dados de machine learning do mundo disponível para a comunidade acadêmica para fins de pesquisa, por meio do seu programa Yahoo Labs Webscope.

Com 13,5 terabytes, a biblioteca é composta por dados de interação entre 20 milhões de usuários anônimos, coletados entre fevereiro de 2015 e maio do mesmo ano, incluindo aqueles que acessaram a homepage do Yahoo e de seus serviços, como Yahoo Notícias, Esportes, Finanças, e Imóveis.

Além disso, os dados possuem informações demográficas, como faixa etária e sexo, dados geográficos genéricos e frases-chave de artigos noticiosos, data e hora local, bem como informações parciais de dispositivos.

De acordo com a diretora de ciência da personalização do Yahoo Labs, Suju Rajan, dados são a força vital por trás da aprendizagem de machine learning, mas o acesso em grande escala à biblioteca “é um privilégio que tradicionalmente é reservado a pesquisadores da área e cientistas de dados que trabalham em grandes companhias – e fora do alcance da maioria dos pesquisadores acadêmicos”, disse. Esse cenário contribui para a demora nas pequisas, pode retardar a inovação e a evolução da tecnologia.

Pesquisadores da Carnegie Mellon University, a Universidade da Califórnia em San Diego; e do UMass Amherst Centro para Ciência de Dados já declararam que utilização a biblioteca para embasar estudos próprios. 

Na Carnegie Mellon, por exemplo, os especialistas poderão estudar como identificar automaticamente quais notícias são de interesse e para quais usuários elas devem ser direcionadas, como conta Tom Mitchell, presidente do departamento de machine learning.

A ideia do Yahoo é nivelar o campo de pesquisa entre indústria e academia e a iniciativa pode tornar esse cenário viável.

Recent Posts

Neil Redding abre IT Forum Praia do Forte 2026 com debate sobre liderança na era da IA

Neil Redding será o palestrante de abertura do IT Forum Praia do Forte 2026. Com…

1 hora ago

47% das empresas brasileiras devem adiar migração para a nuvem nos próximos três anos

Apesar da consolidação da computação em nuvem como um dos pilares da transformação digital, uma…

1 hora ago

Deepfakes, IA e software open source lideram lista de ameaças críticas para empresas, diz Gartner

As equipes de segurança cibernética enfrentarão um cenário cada vez mais complexo nos próximos anos,…

3 horas ago

Apenas um em cada três americanos aprova a construção de data centers

Apenas uma em cada três pessoas dos Estados Unidos aprova o ritmo acelerado de construção…

4 horas ago

Copa do Mundo 2026 vira laboratório global para IA, dados e infraestrutura digital

Desde o início do ano, a redação acompanha como a Copa do Mundo 2026 extrapola…

4 horas ago

NiCE cria hub de pesquisa para acelerar adoção de IA agêntica nas empresas

A NiCE anunciou a criação do NiCE Labs, um laboratório voltado ao desenvolvimento e à…

5 horas ago