Notícias

Nova geração do TensorRT reduz tempo de inferência em IA pela metade

Interfaces de Inteligência Artificial (IA) mais precisas e mais rápidas no processamento de modelos treinados de linguagem, essa é a promessa da Nvidia com o TensorRT 8, nova geração da solução de inferência de IA utilizada por SDKs da Nvidia, anunciado nesta terça-feira (20).

Segundo a companhia, a nova versão do software tem como objetivo dar vazão ao aumento exponencial de complexidade que modelos de inteligência artificial têm observado em setores como Saúde, Finanças e Indústria.

“A versão mais recente do TensorRT apresenta novos recursos que permitem às empresas fornecer aplicativos de IA de conversação a seus clientes com um nível de qualidade e capacidade de resposta nunca antes possível”, resumiu Greg Estes, vice-presidente de programas para desenvolvedores da Nvidia.

O TensorRT é a solução da Nvidia para a chamada “inferência”, ato de utilizar uma rede neural para fornecer insights após ela ter sido treinada em modelos de linguagem natural através de grandes volumes de dados. A solução é utilizada hoje por mais de 350 mil desenvolvedores e triplicou sua base instalada entre os anos de 2019 e 2020.

Leia o texto completo no IT Forum.

Recent Posts

UE ordena que Meta reabra WhatsApp a chatbots rivais

A Comissão Europeia determinou que a Meta reestabeleça o acesso de assistentes de inteligência artificial…

11 horas ago

IPO da SpaceX chega ao mercado como aposta de US$ 1,75 trilhão em IA, não em foguetes

As negociações com as ações da SpaceX têm início nesta quinta-feira, 12, em uma oferta…

11 horas ago

IA muda jornada de compra e devolve relevância aos sites de avaliação B2B, diz Forrester

A ascensão dos agentes de inteligência artificial (IA) está criando uma oportunidade para plataformas de…

12 horas ago

Prêmio Executivo de TI do Ano 2026: conheça os critérios de avaliação

Continuam abertas as inscrições para o prêmio Executivo de TI do Ano 2026. A iniciativa,…

13 horas ago

Meta cria programa de formação para técnicos de data centers em meio à expansão da infraestrutura de IA

A Meta anunciou um investimento de US$ 115 milhões para criar um programa de capacitação…

13 horas ago

Apple apresenta nova geração do Siri AI e amplia aposta em inteligência artificial na WWDC 2026

A Apple utilizou a edição de 2026 da Worldwide Developers Conference (WWDC) para apresentar uma…

13 horas ago