OpenAI lança o modelo o1 com capacidades de “raciocínio”

O modelo, anunciado como o primeiro de uma série, promete responder questões complexas mais rapidamente

Author Photo
3:32 pm - 12 de setembro de 2024
Imagem: Shutterstock

A OpenAI revelou o modelo o1, o primeiro de uma nova série de modelos com habilidades de “raciocínio”, projetado para lidar com perguntas mais complexas de maneira mais eficiente do que os humanos. Juntamente com o o1-mini, uma versão menor e mais acessível, o lançamento marca a chegada do aguardado modelo Strawberry.

Para a OpenAI, o o1 representa um avanço significativo em direção à inteligência artificial que imita o raciocínio humano. Em termos práticos, o modelo se destaca na escrita de código e na resolução de problemas complexos, embora seja mais caro e mais lento que o GPT-4o. A OpenAI descreve o o1 como uma “prévia” para destacar que ainda está em estágio inicial.

Usuários do ChatGPT Plus e Team terão acesso ao o1-preview e ao o1-mini a partir de hoje (12), enquanto os usuários de Enterprise e Edu terão acesso no início da próxima semana. A OpenAI pretende oferecer acesso ao o1-mini para todos os usuários gratuitos do ChatGPT, embora ainda não tenha definido uma data para o lançamento.

Leia também: ABREE lança campanha educacional para conscientizar sobre descarte de resíduos eletrônicos 

O acesso para desenvolvedores ao o1 é bastante caro: o o1-preview custa US$ 15 por 1 milhão de tokens de entrada e US$ 60 por 1 milhão de tokens de saída. Em comparação, o GPT-4o custa US$ 5 por 1 milhão de tokens de entrada e US$ 15 por 1 milhão de tokens de saída.

De acordo com Jerry Tworek, líder de pesquisa da OpenAI, o treinamento do o1 é fundamentalmente diferente dos modelos anteriores. Ele explica que o o1 foi treinado com um novo algoritmo de otimização e um conjunto de dados de treinamento específico para esse modelo.

A OpenAI usou a técnica de aprendizado por reforço para ensinar o o1 a resolver problemas de forma autônoma, recompensando e punindo o sistema durante o processo. O modelo utiliza uma “cadeia de pensamento” para processar consultas, similar ao modo como os humanos resolvem problemas passo a passo.

Como resultado dessa nova metodologia de treinamento, a OpenAI afirma que o modelo é mais preciso. “Observamos que este modelo tenha menos alucinações”, diz Tworek. No entanto, o problema ainda persiste. “Não podemos dizer que resolvemos as alucinações.”

O principal diferencial do o1 em relação ao GPT-4o é sua capacidade de lidar com problemas complexos, como codificação e matemática, e também explicar seu raciocínio. Segundo Bob McGrew, diretor de pesquisa da OpenAI, o o1 demonstrou melhor desempenho em testes de matemática, como o AP math test, e também em exames qualificatórios da Olimpíada Internacional de Matemática, onde obteve uma taxa de acerto de 83%, comparado aos 13% do GPT-4o.

O modelo também teve um bom desempenho em competições de programação online, alcançando o 89º percentil dos participantes. A OpenAI afirma que a próxima atualização do modelo terá um desempenho “semelhante ao de estudantes de doutorado em tarefas desafiadoras nas áreas de física, química e biologia.”

No entanto, o o1 não é tão eficiente quanto o GPT-4o em várias áreas. O modelo não possui um bom desempenho em conhecimentos factuais sobre o mundo e não pode navegar na web ou processar arquivos e imagens. Ainda assim, a empresa acredita que representa uma nova classe de capacidades, com o nome o1 indicando um “recomeço”.

McGrew admite que a OpenAI tem dificuldades com nomes, mas espera que este seja o primeiro passo para nomes mais claros e representativos das suas inovações.

Embora não tenha sido possível fazer uma demonstração direta do o1, McGrew e Tworek mostraram o modelo em uma chamada de vídeo. Eles pediram para resolver um problema complexo de matemática, e o modelo forneceu a resposta correta após 30 segundos de processamento. A interface do o1 mostra os passos de raciocínio enquanto o modelo trabalha, criando uma ilusão de pensamento humano com frases como “Estou curioso sobre” e “Deixe-me ver”.

Apesar de parecer que o modelo está pensando, ele não possui consciência ou inteligência verdadeira. A OpenAI não acredita em equiparar o raciocínio do modelo com o raciocínio humano, mas a interface visa mostrar como o modelo dedica mais tempo ao processamento e à solução de problemas, o que pode dar uma sensação mais humana.

A empresa de IA está investindo em capacidades de raciocínio porque acredita que este é um passo crítico para alcançar a inteligência em nível humano. O objetivo é que modelos com raciocínio possam trazer avanços em áreas como medicina e engenharia, embora, por enquanto, as habilidades de raciocínio do o1 ainda sejam relativamente lentas e caras para os desenvolvedores.

*Com informações do The Verge

Siga o IT Forum no LinkedIn e fique por dentro de todas as notícias!

Tags:
Author Photo
Redação

A redação contempla textos de caráter informativo produzidos pela equipe de jornalistas do IT Forum.

Author Photo

Newsletter de tecnologia para você

Os melhores conteúdos do IT Forum na sua caixa de entrada.