Introducción al modelo o3 de OpenAI

   OpenAI o3 es el modelo de razonamiento más avanzado de OpenAI.Como modelo insignia de la serie O, este modelo establece nuevos puntos de referencia de rendimiento en resolución de problemas complejos, análisis entre dominios y tareas de razonamiento visual, y es particularmente bueno en flujos de trabajo de varios pasos que requieren un razonamiento lógico profundo.

   Es ideal para consultas complejas que requieren un análisis multifacético y donde las respuestas pueden no ser obvias a primera vista. Se desempeña especialmente bien en tareas visuales como el análisis de imágenes, diagramas y gráficos. En evaluaciones realizadas por expertos externos, o3 cometió menos errores críticos que OpenAI o1 en tareas complejas del mundo real, con un rendimiento especialmente bueno en áreas como programación, negocios/consultoría e ideación creativa. Los primeros evaluadores destacaron su rigor analítico como un aliado de pensamiento y su capacidad para generar y evaluar críticamente nuevas hipótesis, especialmente en biología, matemáticas e ingeniería.

   Características principales:La capacidad de razonamiento multimodal o3 permite por primera vez la construcción conjunta de cadenas de pensamiento a partir de imágenes y textos: admite el análisis semántico de entradas visuales de baja calidad, como bocetos de pizarra y diagramas de libros de texto. La función de procesamiento dinámico de imágenes (rotación, escalado y transformación del sistema de coordenadas en tiempo real) presenta una precisión de 86,81 TP3T en el índice de referencia de resolución de problemas visuales de nivel universitario de la MMMU, lo que representa una mejora de 211 TP3T con respecto a la generación anterior.La siguiente figura muestra los datos de rendimiento publicados por el periódico oficial.

imagen 3
 

Documento oficial:https://openai.com/index/introducing-o3-and-o4-mini/

Innovación tecnológica:

- Verificación de la ley de expansión computacional: A través de una expansión computacional de entrenamiento de 10 veces, se verifica la ley de que el rendimiento de inferencia continúa mejorando con los recursos computacionales.

- Aprendizaje de refuerzo de llamadas de herramientas: modelos de entrenamiento para determinar de forma autónoma cuándo usar herramientas y capacidades de procesamiento de escenas abiertas mejoradas por 37%

-Optimización del contexto de memoria: apoyar la referencia de conocimiento a lo largo de los ciclos de conversación y mejorar la relevancia de las respuestas personalizadas mediante 28%

Sistema de seguridad:

-Entrenamiento en clasificación de riesgos: 12 nuevos tipos de estrategias especiales de negación, incluidas amenazas biológicas y ataques de fuga de prisión, etc.

- Marco de monitoreo explicable: Construcción de monitores LLM basados en especificaciones de seguridad legibles para humanos, con una tasa de reconocimiento de diálogo de riesgo biológico de 99%

-Sistema de evaluación de tres niveles: mediante la evaluación de riesgos de bioquímica/ciberseguridad/evolución de la IA, todos los indicadores están por debajo del umbral de "alto riesgo".

   Al mismo tiempo, el funcionario reveló la dirección de desarrollo del modelo OpenAI: integra las capacidades de razonamiento profesional de la serie O con las capacidades de conversación más naturales y el uso de herramientas de la serie GPT. Al integrar estas ventajas,Los modelos futuros admitirán conversaciones naturales y fluidas, así como un uso proactivo de herramientas y capacidades avanzadas de resolución de problemas.

Comparte este artículo

Introducción al modelo o3 de OpenAI

Copiar enlace

Tabla de contenido