Claude 3.7 Introduction au modèle Sonnet

En mars 2024, Anthropic a publié la troisième génération de grands modèles de langage, incluant Claude 3 Haïku, Claude 3 Sonnet et Claude 3 Opus. L'échelle des paramètres et les capacités augmentent progressivement. Trois mois plus tard, en juin 2024,Anthropic lance le modèle Claude 3.5 Sonnet, les fonctionnalités ont été considérablement améliorées, et les deux autres versions n'ont pas été mises à jour. Quatre mois plus tard, en octobre 2024, Anthropic a publié Claude 3.5 Sonnet New, qui équivalait au numéro de version inchangé, mais les fonctionnalités ont été améliorées. Claude 3.5 Haiku a également été publié.

Claude 3.7 Sonnet est le premier grand modèle de l'industrie à prendre en charge le mode de sortie double,Autrement dit, il prend en charge le mode de sortie standard et le mode de raisonnement approfondi.Anthropic estime que les humains n'ont jamais développé deux têtes pour résoudre des problèmes exigeant une réflexion approfondie. Par conséquent, un modèle étendu prenant en charge à la fois des réponses rapides ne nécessitant pas de processus de réflexion et un modèle étendu favorisant la réflexion approfondie est la bonne direction. Le mode de raisonnement profond du Sonnet Claude 3.7 est appelé Sonnet Claude 3.7 avec une pensée étendue de 64 000. Notez que les 64 000 ici devraient correspondre à la longueur du raisonnement.

Le mode d'inférence profonde de Claude 3.7 Sonnet dispose également d'une option que les développeurs peuvent contrôler, à savoirLa longueur maximale de réflexion que le modèle est autorisé à utiliserCe paramètre est spécifié via l'invite système et la page de discussion officielle ne prend pas en charge les options de contrôle.

En termes de raisonnement mathématique, Claude 3.7 Sonnet n'est pas exceptionnel, légèrement inférieur à OpenAI o1, Deepseek-R1, etc.. Mais l'écart n'est pas grand. Mais il est très bon en raisonnement de bon sens et en programmation. En particulier en programmation, dans la programmation de scénarios réels tels que SWE-Bench, Claude 3.7 Sonnet est bien meilleur que les autres modèles sans utiliser le mode de raisonnement (il n'y a pas de données en mode de raisonnement).

Autres données de comparaison officielles (photos prises à partir du site officiel) :

Claude 3.7 est désormais disponible pour les utilisateurs gratuits et les interfaces API sont disponibles sur AWS, Google et d'autres services cloud

Actuellement, le modèle Claude 3.7 Sonnet est disponible sur le site officiel, accessible aux utilisateurs gratuits et payants. Cependant, les utilisateurs gratuits ne peuvent pas utiliser le mode de réflexion approfondie, contrairement aux utilisateurs payants. Parallèlement, outre le site officiel d'Anthropic, AWS et Google fournissent également des services d'interface pour le grand modèle Claude 3.7 Sonnet (les services de grands modèles d'AWS et de Google ne devraient pas être très performants).

De plus, le prix de l'interface API du modèle Claude 3.7 Sonnet est identique à celui de la version précédente, qu'il s'agisse ou non de raisonnement profond. L'entrée coûte 3 $ par million de jetons, et la sortie coûte 15 $ par million de jetons.

Claude 3.7 Introduction au modèle Sonnet

Claude 3.7 Introduction au modèle Sonnet

Table des matières