大模型竞争愈发激烈：Anthropic推出混合推理模型，可控制模型思考时间-新闻动态-北京科技股份有限公司

大模型竞争愈发激烈：Anthropic推出混合推理模型，可控制模型思考时间

时间：2025-02-25 17:30:03 浏览：488

2月25日，由亚马逊支持的AI初创公司Anthropic推出首个混合推理模型Claude 3.7 Sonnet。它可以产生近乎即时的反应和对用户可见、可扩展的逐步思考。API用户还可以控制模型思考时间。

Anthropic表示，正如人类使用一个大脑进行快速反应和深度思考一样，推理应该是前沿模型的综合能力，而不是完全独立的模型。这种统一方法可以为用户创造无缝体验。Claude 3.7 Sonnet既是一个普通的大模型，也是一个推理模型，用户可以选择何时让模型在标准模式下回答，何时让模型在回答前思考更长时间。Anthropic联合创始人兼首席科学官贾里德·卡普兰（Jared Kaplan）表示：“我们想要一个连贯的人工智能，它可以帮助我们做任何事情。”

在标准模式下，Claude 3.7 Sonnet是Claude 3.5 Sonnet的升级版(bǎn)。在(zài)扩(kuò)展(zhǎn)思(sī)维(wéi)模(mó)式(shì)下(xià)，Claude 3.7 Sonnet在(zài)回(huí)答(dá)问(wèn)题(tí)前(qián)会(huì)自(zì)我(wǒ)反(fǎn)思(sī)，数(shù)学(xué)、物(wù)理(lǐ)、指(zhǐ)令(lìng)遵(zūn)循(xún)、编(biān)程(chéng)等(děng)任(rèn)务(wu)上(shàng)的(de)表(biǎo)现(xiàn)得(de)到(dào)提(tí)高(gāo)。

在标准模型和扩展思维模式下，Claude 3.7 Sonnet每百万输入token为3美元，每百万输出token为15美元，其中包括思考的token。当通过API使用Claude 3.7 Sonnet时(shí)，用(yòng)户(hù)还(hái)可(kě)以(yǐ)控(kòng)制(zhì)思(sī)考(kǎo)的(de)预(yù)算(suàn)，在(zài)速(sù)度(dù)和(hé)成(chéng)本(běn)上(shàng)换(huàn)取(qǔ)质量，例如用户可以要求Claude思考不超过多少个token。

Anthropic表示，扩展思维模式使模型在数学、物理、指令遵循、编程等任务方面获得提升。

Anthropic产品负责人、Instagram的联合创始人迈克·克里格（Mike Krieger）表示，这种混合方式可以简化聊天机器人流程，用户可以使用多种功能，而不需要考虑哪个是最好的选择。

Anthropic在开发推理模型时降低了对数学和计算机科学竞赛问题的优化程度，而是将优化的重点转移到现实世界任务上，这些任务更好地反映企业实际如何使用大模型。

Claude 3.7 Sonnet在编程和前端网络开发方面优化改进，并引入一个用于智能编程的命令行工具Claude Code。Claude Code可以搜索和读取代码、编辑文件、编写和运行测试、提交和推送代码到GitHub，并使用命令行工具，开发者可以直接将大量工程任务委托给Claude Code。

在早期测试中，Claude Code一次性完成了通常需要45分钟以上手动工作的任务，减少了开发时间和开销。Anthropic表示，在接下来的几周里计划根据开发者的使用情况继续改进，增强工具调用的可靠性、增加对长时间运行命令的支持等。

“我们使用Claude Code的目标是更好地理解开发者如何使用Claude编程，为未来的模型改进提供信息。”Anthropic表示，Claude 3.7 Sonnet是该企业迄今最好的编程模型，随着对用户工作和开源项目的深入了解，它可以在GitHub项目中修复bug（漏洞）、开发功能和构建文档(dàng)。

2月(yuè)以来，大模型竞争态势愈发激烈。2月18日，特斯拉创(chuàng)始(shǐ)人(rén)埃(āi)隆(lóng)·马(mǎ)斯克旗下xAI推出最新大模型Grok 3。Grok 3和轻量化的Grok 3 mini在多个性能上超过或媲美Gemini、DeepSeek和GPT-4o等对手。Grok 3在xAI位于(yú)孟(mèng)菲(fēi)斯(sī)的(de)Colossus超(chāo)算(suàn)中(zhōng)心(xīn)进(jìn)行(xíng)训(xun)练(liàn)。xAI透(tòu)露(lù)，这(zhè)一(yī)超算中心的算力已经翻倍，拥有的英伟达GPU数量达20万颗。

2月13日，OpenAI首席执行官山姆·奥特曼（Sam Altman）在社交媒体上表示，下一个将发布的模型是OpenAI最后一个非思维链模型GPT-4.5，也被称为Orion（猎户座）模型。在那之后，OpenAI的最高目标是创建可以使用所有工具的系统来统一o系列模型和GPT系列模型，它能够知道什么时候应该长时间思考，并且通常适用于广泛任务。OpenAI将(jiāng)发(fā)布(bù)GPT-5，GPT-5将(jiāng)成(chéng)为(wèi)一(yī)个(gè)集成(chéng)o3模(mó)型(xíng)等(děng)OpenAI诸(zhū)多(duō)技(jì)术(shù)的(de)系(xì)统(tǒng)。“我(wǒ)们(men)希(xī)望(wàng)AI ‘只(zhǐ)为(wèi)你(nǐ)工(gōng)作(zuò)’，我(wǒ)们(men)意(yì)识(shi)到(dào)我(wǒ)们的模式和产品供应变得多么复杂。我们和你一样讨厌模型选择器，希望回归神奇的统一智能。”