Introducción al modelo de soneto Claude 3.7

   En marzo de 2024, Anthropic lanzó la tercera generación de modelos lingüísticos de gran tamaño, que incluyen Claude 3 Haiku, Claude 3 Sonnet y Claude 3 Opus. La escala de parámetros aumenta progresivamente, al igual que las capacidades. Tres meses después, en junio de 2024,Anthropic lanza el modelo Claude 3.5 SonnetLas capacidades se mejoraron considerablemente y las otras dos versiones no se actualizaron. Cuatro meses después, en octubre de 2024, Anthropic lanzó Claude 3.5 Sonnet New, que equivalía a que el número de versión no cambiara, pero con capacidades mejoradas. También se lanzó Claude 3.5 Haiku.

   Claude 3.7 Sonnet es el primer modelo grande de la industria que admite el modo de salida dual,Es decir, admite el modo de salida estándar y el modo de razonamiento profundo.Anthropic cree que los humanos nunca han desarrollado dos cabezas para los problemas que requieren pensamiento profundo. Por lo tanto, un modelo amplio que admita tanto respuestas rápidas que no requieran un proceso de pensamiento como un modelo amplio que admita el pensamiento profundo es la dirección correcta. El modo de razonamiento profundo de Claude 3.7 Sonnet se denomina Claude 3.7 Sonnet con pensamiento extendido de 64K. Cabe destacar que 64K debe ser la longitud del razonamiento.

   El modo de inferencia profunda de Claude 3.7 Sonnet también tiene una opción que los desarrolladores pueden controlar, a saber:La longitud máxima de pensamiento que se le permite utilizar al modeloEsta configuración se especifica a través del Símbolo del sistema y la página de chat oficial no admite opciones de control.

En términos de razonamiento matemático, Claude 3.7 Sonnet no es sobresaliente, ligeramente inferior a OpenAI o1, Deepseek-R1, etc.Pero la diferencia no es grande. Sin embargo, es muy bueno en razonamiento y programación basados en el sentido común. Especialmente en programación, en la programación de escenarios reales como SWE-Bench, Claude 3.7 Sonnet es mucho mejor que otros modelos sin usar el modo de razonamiento (no hay datos en el modo de razonamiento).

Otros datos oficiales de comparación (imágenes tomadas del sitio oficial):

imagen 4
 

Claude 3.7 ya está disponible para usuarios gratuitos y las interfaces API están disponibles en AWS, Google y otros servicios en la nube.

   Actualmente, el modelo Claude 3.7 Sonnet está disponible en el sitio web oficial, y tanto los usuarios gratuitos como los de pago pueden usarlo. Sin embargo, los usuarios gratuitos no pueden usar el modo de pensamiento profundo, pero los de pago sí. Además del sitio web oficial de Anthropic, AWS y Google también ofrecen servicios de interfaz para el modelo grande Claude 3.7 Sonnet (los servicios de modelos grandes de AWS y Google no deberían ser muy buenos).

   Además, el precio de la interfaz API del modelo Claude 3.7 Sonnet es el mismo que el de la versión anterior, independientemente de si se trata de razonamiento profundo. La entrada cuesta $3 por millón de tokens y la salida cuesta $15 por millón de tokens.

Comparte este artículo

Introducción al modelo de soneto Claude 3.7

Copiar enlace

Tabla de contenido