Como a busca do ChatGPT abre caminho para agentes de IA
Para que assistentes de IA se tornem realmente úteis, algumas mudanças precisam ser implementadas. Entenda
Recentemente, Olivier Godement, chefe de produto da OpenAI, e Romain Huet, responsável pela experiência do desenvolvedor da OpenAI, realizaram uma intensa turnê mundial. Em Londres, antes da DevDay, conferência anual de desenvolvedores da empresa, eles discutiram as últimas inovações e atualizações da OpenAI. O evento marca a primeira vez que a DevDay aconteceu fora de São Francisco, e a próxima parada da dupla será em Cingapura.
A OpenAI tem se mantido ocupada nas últimas semanas. Durante o evento em Londres, anunciaram melhorias em sua nova plataforma de API em tempo real, que permitirá aos desenvolvedores integrarem recursos de voz em suas aplicações.
Segundo informações do MIT Technology Review, a empresa também apresentou novos tipos de vozes e uma funcionalidade que ajuda a gerar prompts, acelerando o desenvolvimento de aplicativos e assistentes de voz mais úteis. Outra novidade foi o lançamento da busca do ChatGPT, que possibilita aos usuários pesquisarem na internet utilizando o chatbot.
Esses avanços pavimentam o caminho para o que pode ser a próxima grande inovação em IA: os agentes. Esses assistentes inteligentes serão capazes de completar tarefas complexas, como reservar voos. Godement prevê que, em alguns anos, “cada ser humano, cada empresa terá um agente. Esse agente te conhece extremamente bem e tem acesso a seus e-mails, aplicativos e calendários, atuando como um chefe de gabinete, interagindo com todas essas ferramentas e resolvendo problemas a longo prazo.”
Leia também: A chegada da Scale Computing ao Brasil: inovação em infraestrutura hiperconvergente
OpenAI e agentes de IA
A estratégia da OpenAI envolve tanto a construção de seus agentes quanto a permissão para que desenvolvedores utilizem seu software para criar assistentes próprios, com a voz desempenhando um papel crucial nesse desenvolvimento. Godement destaca que, embora muitos aplicativos atuais sejam baseados em texto, há situações em que a interação por voz é mais adequada, especialmente quando o usuário não está olhando para a tela ou digitando.
No entanto, para que esses agentes se tornem uma realidade, existem dois grandes obstáculos a serem superados. O primeiro deles é a capacidade de raciocínio. É necessário que os agentes possam completar tarefas complexas de forma confiável.
Huet explica que a nova funcionalidade de “raciocínio” da OpenAI, introduzida no modelo o1, utiliza o aprendizado por reforço para ensinar o modelo a processar informações através de um “fluxo de pensamento”. Isso significa que, ao permitir que o modelo tenha mais tempo para gerar respostas, ele pode reconhecer e corrigir erros, fragmentar problemas em partes menores e experimentar diferentes abordagens.
No entanto, a afirmativa da OpenAI sobre a capacidade de raciocínio deve ser vista com cautela. Chirag Shah, professor de ciência da computação na Universidade de Washington, adverte que os grandes modelos de linguagem não demonstram raciocínio verdadeiro.
Segundo ele, esses modelos podem parecer impressionantes, mas estão apenas imitando padrões que aprenderam durante seu treinamento. “Esses modelos às vezes parecem incríveis em raciocínio, mas na verdade são ótimos em simular essa habilidade, e basta um pouco de pressão para que sua lógica comece a falhar”, afirma.
Godement reconhece que ainda há muito trabalho a ser feito. No curto prazo, modelos como o1 precisam ser mais confiáveis, rápidos e acessíveis. Já no longo prazo, a OpenAI pretende aplicar sua técnica de fluxo de pensamento em uma gama mais ampla de casos de uso, expandindo seu foco para áreas como direito, contabilidade e economia, além das ciências, codificação e matemática.
O segundo item na lista de prioridades é a capacidade de conectar diferentes ferramentas. A eficácia de um modelo de IA será limitada se ele depender apenas dos dados com os quais foi treinado. Ele precisa ser capaz de acessar a internet para buscar informações atualizadas. A busca do ChatGPT é uma maneira poderosa de permitir que as novas ferramentas da OpenAI façam isso.
Essas ferramentas devem não apenas recuperar informações, mas também realizar ações no mundo real. Por exemplo, a Anthropic, uma concorrente, anunciou um recurso que permite que seu chatbot Claude “use” um computador, interagindo com sua interface para executar cliques. Godement menciona que o modelo o1 pode “meio que” usar ferramentas, embora de forma não confiável, e que a pesquisa sobre o uso de ferramentas representa um “desenvolvimento promissor”.
Nos próximos anos, Godement espera que a adoção de IA para suporte ao cliente e outras tarefas de assistente cresça. Contudo, ele admite que prever como as pessoas adotarão e utilizarão a tecnologia da OpenAI pode ser desafiador. “Sinceramente, olhando para trás, a cada ano fico surpreso com os casos de uso que surgem e que eu não antecipava”, conclui. “Acredito que haverá muitas surpresas que nenhum de nós poderia prever.”
Siga o IT Forum no LinkedIn e fique por dentro de todas as notícias!