
OpenAI lança novo modelo de IA “o1” com recursos avançados de raciocínio
Criado em 12 de setembro de 2024 . Novidades • 3,889 visualizações • 5 minutos de leitura
OpenAI revela o modelo de IA o1, aprimorando as habilidades de resolução de problemas e raciocínio
Em 12 de setembro de 2024, a OpenAI apresentou seu novo modelo de IA altamente antecipado, o o1, como parte de sua série contínua de sistemas de IA projetados para aprimorar as capacidades de raciocínio. Internamente chamado de “Strawberry” durante o desenvolvimento, o modelo o1 agora está sendo lançado junto com uma variante menor e mais acessível chamada o1-mini. Esses modelos são os primeiros de uma série planejada de sistemas de IA focados em lidar com tarefas complexas que exigem raciocínio lógico, codificação e resolução de problemas em várias etapas — tarefas que antes estavam além das capacidades de seus predecessores, como o GPT-4o.
O lançamento da OpenAI marca um salto significativo na tecnologia de IA, oferecendo uma versão de pré-visualização do o1 para assinantes do ChatGPT Plus e Team a partir de hoje, enquanto usuários corporativos e educacionais devem obter acesso no início da semana que vem. O acesso do desenvolvedor ao modelo o1 por meio da API da OpenAI, no entanto, tem um preço alto, com custos significativamente mais altos do que aqueles do GPT-4o amplamente usado.
Abrindo caminho no raciocínio
O modelo o1 se destaca das iterações anteriores de IA, incluindo GPT-4o, devido às suas capacidades de raciocínio refinadas. Ao contrário de seus predecessores, que foram treinados para imitar padrões de vastos conjuntos de dados, o o1 foi projetado especificamente para resolver problemas por conta própria usando aprendizado por reforço. Este novo método de treinamento permite que o o1 processe consultas dividindo-as passo a passo, muito parecido com o raciocínio humano.
De acordo com o líder de pesquisa da OpenAI, Jerry Tworek, o o1 foi treinado com um novo algoritmo de otimização e um conjunto de dados especializado projetado para desafiar suas habilidades de raciocínio. Essa nova abordagem torna o o1 mais apto a resolver problemas complexos de codificação, matemática avançada e tarefas científicas. Apesar de seus avanços, Tworek reconheceu que o modelo tem suas limitações, particularmente quando se trata de "alucinações" ou geração de informações incorretas ou enganosas.
“Notamos que esse modelo alucina menos”, disse Tworek. “Mas o problema ainda persiste. Não podemos dizer que resolvemos as alucinações.”
As melhorias no raciocínio são evidentes em testes práticos. O diretor de pesquisa da OpenAI, Bob McGrew, destacou como o o1 superou o GPT-4o em desafios baseados em matemática e lógica. Por exemplo, o o1 obteve 83% em um exame de qualificação para a Olimpíada Internacional de Matemática, em comparação com a taxa de sucesso de 4% do GPT-13o.
“Passamos muitos meses trabalhando no raciocínio porque achamos que esse é realmente o avanço crítico”, disse McGrew. “Fundamentalmente, essa é uma nova modalidade para modelos a fim de ser capaz de resolver os problemas realmente difíceis que são necessários para progredir em direção a níveis de inteligência semelhantes aos humanos.”
Codificação avançada e resolução de problemas em várias etapas
Uma das principais áreas em que o o1 brilha é sua capacidade de lidar com tarefas complexas de codificação. A OpenAI afirma que o modelo tem um desempenho excepcionalmente bom em competições de codificação como a Codeforces, onde atingiu o 89º percentil de participantes. O modelo também é melhor em explicar seu raciocínio à medida que trabalha com problemas, oferecendo aos usuários uma compreensão mais clara de como ele chega às soluções.
A OpenAI projetou o modelo o1 para processar tarefas de forma similar aos processos de pensamento humano. Em demonstrações, o modelo demonstrou a capacidade de decompor quebra-cabeças e problemas matemáticos passo a passo, frequentemente usando frases como "Estou pensando" ou "Deixe-me ver" para simular o raciocínio humano. No entanto, a OpenAI é rápida em notar que, embora o modelo possa parecer mais humano em sua abordagem de raciocínio, ele não está realmente "pensando" como um humano.
Durante uma demonstração, o modelo o1 foi solicitado a resolver um quebra-cabeça complexo envolvendo as idades de um príncipe e uma princesa. O modelo levou cerca de 30 segundos para entregar a resposta correta enquanto mostrava cada passo de seu raciocínio, imitando um processo de dedução lógica.
Essa nova capacidade de raciocínio torna o o1 bem adequado para indústrias que exigem resolução de problemas complexos, como saúde, engenharia e pesquisa científica avançada. A OpenAI sugeriu que o o1 poderia ajudar a anotar dados complexos de sequenciamento de células em biologia ou auxiliar físicos na geração de fórmulas matemáticas intrincadas para óptica quântica.
Preços e Acessibilidade
Embora o modelo o1 traga avanços significativos no raciocínio, ele vem com um alto preço. Na API OpenAI, o modelo o1-preview custa US$ 15 por milhão de tokens de entrada e US$ 60 por milhão de tokens de saída — muito mais caro do que o GPT-4o, que tem preço de US$ 5 e US$ 15, respectivamente, para as mesmas contagens de tokens.
Apesar do custo, a OpenAI está tornando o modelo o1-mini mais acessível. Esta versão menor do modelo é projetada para respostas mais rápidas e acessíveis, tornando-a ideal para usuários com necessidades mais simples ou aqueles focados em consultas relacionadas a STEM. A OpenAI declarou que o o1-mini será disponibilizado para todos os usuários do ChatGPT de nível gratuito, embora nenhuma data de lançamento específica tenha sido definida.
A partir de hoje, assinantes do ChatGPT Plus e Team poderão experimentar o o1-preview e o o1-mini com um limite de 30 e 50 mensagens, respectivamente. Usuários corporativos e educacionais ganharão acesso na semana que vem, enquanto desenvolvedores poderão prototipar com ambos os modelos por meio da API do OpenAI, embora com certos limites de taxa.
Limitações e Desenvolvimentos Futuros
Embora o o1 se destaque em raciocínio e resolução de problemas, ele não tem algumas das funcionalidades presentes no GPT-4o. Por exemplo, o modelo o1 não suporta navegação na web, processamento de arquivos ou imagens ou manipulação de mensagens personalizadas do sistema. Essas omissões significam que o o1 não é um substituto direto para o GPT-4o em muitas aplicações, mas sim posicionado como uma ferramenta complementar para resolver tarefas mais complexas e intensivas em raciocínio.
Apesar de suas limitações, a OpenAI acredita que o modelo o1 representa um passo significativo à frente no desenvolvimento de IA. À medida que a empresa continua a refinar o modelo e coletar feedback, futuras atualizações do o1 devem introduzir novos recursos e melhorias. A OpenAI também está planejando aprimorar a série o1 com recursos como navegação e upload de arquivos, tornando os modelos mais versáteis e práticos para uma gama mais ampla de aplicações.
“Estamos zerando o contador de volta para 1 com este modelo”, disse McGrew, referindo-se à convenção de nomenclatura do modelo. “É o primeiro passo em direção a uma nova classe de capacidades de IA, e há mais por vir.”
O lançamento do o1 e sua mini variante marcam um momento crucial no cenário da IA. Com suas habilidades de raciocínio aprimoradas, o modelo o1 está pronto para fazer contribuições significativas para campos que exigem resolução de problemas complexos, desde codificação até pesquisa científica avançada. Embora ainda não seja um substituto completo para o GPT-4o em muitos casos de uso, o o1 representa o início de uma nova era no desenvolvimento de IA.
À medida que a OpenAI continua a expandir os limites do que a IA pode alcançar, futuras atualizações da série o1 prometem trazer recursos ainda mais poderosos, diminuindo ainda mais a lacuna entre a inteligência humana e a das máquinas.
Publicações Populares
-
-
A revelação do Cybercab Robotaxi da Tesla decepciona os investidores, as ações caem 9%• 11,328 visualizações
-
Internet Archive sofre grande violação de dados, afetando 31 milhões de usuários• 7,167 visualizações
-
Meta revela Orion: o futuro dos óculos de realidade aumentada• 7,109 visualizações
-
Nintendo apresenta Alarmo: uma nova era de despertadores interativos• 6,740 visualizações