Introdução ao modelo OpenAI o3 O OpenAI o3 é o modelo de raciocínio mais avançado do OpenAI.Como modelo principal da série O, este modelo estabelece novos padrões de desempenho em resolução de problemas complexos, análise entre domínios e tarefas de raciocínio visual, e é particularmente bom em fluxos de trabalho de várias etapas que exigem raciocínio lógico profundo. É adequado para consultas complexas que exigem análises multifacetadas e onde as respostas podem não ser imediatamente óbvias. Apresenta um desempenho particularmente bom em tarefas visuais, como análise de imagens, tabelas e diagramas. Em avaliações de especialistas externos, o o3 cometeu menos erros críticos do que o OpenAI o1 em tarefas difíceis do mundo real, apresentando um desempenho particularmente bom em áreas como programação, negócios/consultoria e ideação criativa. Os primeiros testadores destacaram seu rigor analítico como um parceiro de pensamento e sua capacidade de gerar e avaliar criticamente novas hipóteses, especialmente em biologia, matemática e engenharia. Principais recursos:O recurso de raciocínio multimodal o3 realiza pela primeira vez a construção conjunta de cadeias de pensamento de imagens e textos: ele suporta a análise semântica de entradas visuais de baixa qualidade, como esboços de quadro branco e diagramas de livros didáticos. A função de processamento dinâmico de imagens (rotação/escala/transformação do sistema de coordenadas em tempo real) tem uma precisão de 86,81 TP3T no benchmark de resolução de problemas visuais de nível universitário da MMMU, uma melhoria de 211 TP3T em relação à geração anterior.A figura abaixo mostra os dados de desempenho divulgados pelo jornal oficial. Jornal oficial:https://openai.com/index/introducing-o3-and-o4-mini/ Inovação tecnológica: - Verificação da lei de expansão da computação: por meio da expansão da computação de treinamento de 10 vezes, a lei de que o desempenho da inferência continua a melhorar com os recursos de computação é verificada - Aprendizagem por reforço de chamada de ferramenta: modelos de treinamento para determinar autonomamente quando usar ferramentas e recursos de processamento de cena aberta aprimorados pelo 37% - Otimização do contexto de memória: suporte à referência de conhecimento em ciclos de conversação e melhore a relevância de respostas personalizadas por 28% Sistema de segurança: - Treinamento de classificação de risco: 12 novos tipos de estratégias especiais de negação, incluindo ameaças biológicas e ataques de fuga de presos, etc. - Estrutura de monitoramento explicável: construção de monitores LLM com base em especificações de segurança legíveis por humanos, com uma taxa de reconhecimento de diálogo de risco biológico de 99% - Sistema de avaliação de três níveis: por meio da avaliação de risco de evolução da bioquímica/segurança cibernética/IA, todos os indicadores estão abaixo do limite de "alto risco". Ao mesmo tempo, o executivo também revelou a direção de desenvolvimento do modelo OpenAI: ele integra os recursos de raciocínio profissional da série O com os recursos de conversação mais naturais e o uso de ferramentas da série GPT. Ao integrar essas vantagens,Os modelos futuros oferecerão suporte a conversas naturais e fluidas, bem como ao uso proativo de ferramentas e recursos avançados de resolução de problemas.