Claude 3.7 Sonnet 模型简介 2024年3月份,Anthropic发布了第三代大语言模型,包含Claude 3 Haiku、Claude 3 Sonnet和Claude 3 Opus。参数规模依次增大,能力依次增强。三个月后的2024年6月份,Anthropic发布了Claude 3.5 Sonnet模型,能力大幅增强,另外两个版本没有更新。4个月后2024年的10月份,Anthropic发布了Claude 3.5 Sonnet New,相当于版本号没变,但是能力提升。同时发布了Claude 3.5 Haiku。 Claude 3.7 Sonnet是业界第一个支持双重输出模式的大模型,即支持标准输出模式以及深度推理模式。Anthropic认为,人类从来没有因为需要深度思考的问题而长出两个脑袋,因此,一个既支持不需要思考过程的快速响应的大模型,也可以支持深度思考之后的大模型才是正确的方向。Claude 3.7 Sonnet深度推理模式被称为Claude 3.7 Sonnet with 64K extended thinking。注意,这里的64K应该是推理的长度。 Claude 3.7 Sonnet深度推理模式还有一个开发者可以控制的选项,即最多允许模型使用多长的思考长度。这个设置通过System Prompt指定,而官网的Chat网页不支持控制选项。 在数学推理方面,Claude 3.7 Sonnet并不突出,比OpenAI o1、Deepseek-R1等都略低。但是差距不大。但是在常识推理和编程方面都很好。特别是编程,在SWE-Bench这种现实场景的编程方面Claude 3.7 Sonnet不使用推理模式也大幅好于其它模型(推理模式没有数据)。 官方给出的其他对比数据(图片取自官方): Claude 3.7已经对免费用户开放,API接口在AWS、Google等云服务都有提供 当前,Claude 3.7 Sonnet模型已经在官网可以使用,免费用户和付费用户都可以使用。但是免费用户不能使用深度思考模式。付费用户可以。同时,除了Anthropic官网,AWS和Google也都提供了Claude 3.7 Sonnet大模型的接口服务(AWS与Google自家大模型服务应该是不太爽的)。 此外,Claude 3.7 Sonnet模型的API接口价格和上一个版本一样,不区分是否深度推理,输入每100万tokens是3美元,输出是每100万tokens花费15美元。