All Rights ReservedView Non-AMP Version
IT Forum
  • Homepage
  • Tendências
Notícias

5 linguagens de programação para cientistas de dados aprenderem

À medida que aumenta o uso de tecnologias baseadas em dados e as organizações aceleram a transformação digital, sobretudo, impulsionadas pela pandemia de Covid-19, aumenta-se a necessidade de gerenciar uma quantidade ainda maior de dados. Para dar conta disso, empresas e profissionais de TI precisam escolher conscientemente as linguagens de programação que usarão nesse processo. Um artigo publicado no site TechRepublic apresenta as cinco principais linguagens de programação que todo cientista de dados deve aprender para manusear grandes conjuntos de dados, entre eles: R, Java e Julia.

Jesus Vigo, empresário e especialistas com 19 anos de experiência, selecionou as linguagens mais preparadas para o manuseio de grandes conjuntos de dados. “As linguagens de programação abaixo estão preparadas para ser eficientes no manuseio de grandes conjuntos de dados e robustas em sua união de múltiplas fontes de dados para extrair efetivamente as informações necessárias para fornecer insight e compreensão dos fenômenos que existem nos fluxos de dados para mineração e machine learning, entre outros”, escreve Vigo.

As melhores notícias de tecnologia B2B
Acompanhe todas as novidades diretamente na sua caixa de entrada

O autor selecionou e detalhou cada uma das cinco linguagens que considerou principais: Python, R, Java, Julia e Scala.

Python

Elogiado por desenvolvedores de software e cientistas de dados, Python tem se mostrado a linguagem de programação preferida por sua facilidade de uso e sua natureza dinâmica. É madura e estável, sem falar que é compatível com algoritmos de alto desempenho, permitindo a interface com tecnologias avançadas, como machine learning, análise preditiva e inteligência artificial (IA) por meio de bibliotecas ricas e suportadas em seu extenso ecossistema. Além de seus pontos fortes como uma linguagem de deep learning, Python também desfruta de suporte quase inigualável em uma variedade de sistemas operacionais para auxiliar no processamento de dados de quase qualquer fonte nativamente.

R

R é frequentemente comparada ao Python em que seus pontos fortes inerentes são semelhantes devido à sua natureza de código aberto e design independente do sistema para suportar a maioria dos sistemas operacionais. E, embora ambas as linguagens sejam excelentes em ciência de dados e círculos de machine learning, o R foi desenvolvido e se apoia fortemente em modelos estatísticos e computação. A exploração de dados oferece uma série de operações que podem ser realizadas para classificar e gerar dados, modificar, mesclar e distribuir conjuntos de dados com precisão para deixá-los prontos para sua formatação representativa final. Por último, a visualização de dados é outro ponto em que R se especializa, com uma série de pacotes que auxiliam na representação gráfica dos resultados com gráficos e plotagens, incluindo plotagem complexa de análise numérica.

Java

Java existe há cerca de um quarto de século e, durante este tempo, a linguagem orientada a objetos baseada em classes aderiu ao credo “escreva uma vez, execute em qualquer lugar (WORA)”, estabelecendo-o como exigindo o mínimo de dependências possível – independentemente de onde seu código será executado. Isso se estende aos aplicativos executados na máquina virtual Java (JVM), que podem ser executados independentemente do sistema operacional subjacente, permanecendo amplamente independente do sistema. É a plataforma de escolha para algumas das ferramentas mais amplamente usadas em big data analytics, como Apache Hadoop e Scala. Suas bibliotecas de machine learning maduras, estruturas de big data e escalabilidade nativa permitem acessar quantidades quase ilimitadas de armazenamento enquanto gerencia muitas tarefas de processamento de dados em sistemas em cluster.

Julia

Comparada com as outras linguagens de programação desta lista, Julia é a linguagem mais recente com menos de 10 anos desde seu lançamento inicial. Mas você se enganaria se confundisse isso com falta de maturidade porque, apesar de estar entre as linguagens mais novas, Julia está crescendo continuamente em popularidade entre os cientistas de dados que exigem uma linguagem dinâmica capaz de realizar análises numéricas em um ambiente de computação de alto desempenho. Graças em parte aos seus tempos de execução mais rápidos, ele não apenas fornece um desenvolvimento mais rápido, mas também produz aplicativos que rodam de forma semelhante aos criados em linguagens de baixo nível, como C por exemplo. Uma desvantagem relativamente pequena para Julia é que a comunidade não é tão robusta quanto a de outras linguagens, limitando as opções de suporte – no entanto, isso é parte das dificuldades crescentes de qualquer tecnologia mais recente que funcionará sozinha à medida que a tecnologia crescer.

Scala

Uma linguagem de programação de alto nível baseada na plataforma JVM, Scala foi projetada para aproveitar muitos dos mesmos benefícios que o Java aborda algumas de suas deficiências. O Scala foi projetado para ser altamente escalonável e, como tal, perfeitamente adequado para lidar com as complexidades do big data. Isso inclui compatibilidade com estruturas de ciência de dados de alto desempenho baseadas em Java, como Hadoop, por exemplo. Ela também contribui para uma estrutura de computação em cluster flexível, altamente escalonável e de código aberto quando emparelhado com o Apache Spark, e capaz de usar grandes pools de recursos de hardware com eficiência.

Fonte: TechRepublic

Next Esses são os 20 cursos mais populares do LinkedIn. E estão de graça »
Previous « 5 segredos para desenvolver um currículo atraente para os robôs de recrutamento
Leave a Comment
Share
Published by
Redação
Tags: carreiraciência de dadosLinguagens de programação
6 anos ago

    Related Post

  • HPE une rede e segurança e mira fim da gestão fragmentada
  • Consumidores ainda resistem a delegar pagamentos a agentes de IA, indica Forrester
  • Anthropic alerta governo Trump sobre riscos cibernéticos expostos por modelos avançados de IA

Recent Posts

  • Notícias

Empresas não sabem como comprar IA, e esse é o maior obstáculo da adoção, diz executivo da HPE

A maioria das empresas que hoje investe em inteligência artificial não sabe exatamente quem deve…

6 horas ago
  • Notícias

Datamint capta R$ 25 milhões em rodada seed liderada pela Headline

A Datamint, startup brasileira de inteligência artificial (IA) voltada à gestão de ativos em operações…

6 horas ago
  • Notícias

Consumidores ainda resistem a delegar pagamentos a agentes de IA, indica Forrester

Os consumidores ainda não estão preparados para permitir que agentes de inteligência artificial (IA) realizem…

7 horas ago
  • Notícias

Anthropic alerta governo Trump sobre riscos cibernéticos expostos por modelos avançados de IA

A Anthropic intensificou seus alertas ao governo dos Estados Unidos sobre os riscos cibernéticos associados…

8 horas ago
  • Notícias

HPE une rede e segurança e mira fim da gestão fragmentada

Por anos, equipes de TI operaram segurança e rede como disciplinas separadas, com ferramentas distintas,…

8 horas ago
  • Notícias

Gwynne Shotwell afasta pressão por IPO e diz que SpaceX mantém foco no longo prazo

A presidente e COO da SpaceX, Gwynne Shotwell, afirmou que a abertura de capital da…

9 horas ago
All Rights ReservedView Non-AMP Version
  • L