Anthropic 推出新一代混合推理模型 Claude 3.7 Sonnet：该公司“最智能”AI 模型

==> 1 ok ==> 2 ok ==> 3 ok ==> 4 ok ==> 5 ok ==> 6 ok ==> 7 ok ==> 8 ok ==> 9 ok ==> 10 ok ==> 11 ok ==> 12 ok ==> 13 ok ==> 14 ok ==> 15 ok ==> 16 ok ==> 17 ok ==> 18 ok ==> 19 ok ==> 20 ok ==> 21 ok ==> 22 ok ==> 23 ok ==> 24 ok ==> 25 ok ==> 26 ok ==> 27 ok ==> 28 ok ==> 29 ok ==> 30 ok ==> 31 ok ==> 32 ok ==> 33 ok ==> 34 ok ==> 35 ok ==> 36 ok ==> 37 ok ==> 38 ok ==> 39 ok ==> 40 ok ==> 41 ok ==> 42 ok ==> 43 ok ==> 44 ok ==> 45 ok ==> 46 ok ==> 47 ok ==> 48 ok ==> 49 ok ==> 50 ok ==> 1 ok ==> 2 ok ==> 3 ok ==> 4 ok ==> 5 ok ==> 6 ok ==> 7 ok ==> 8 ok ==> 9 ok ==> 10 ok ==> 11 ok ==> 12 ok ==> 13 ok ==> 14 ok ==> 15 ok ==> 16 ok ==> 17 ok ==> 18 ok ==> 19 ok ==> 20 ok ==> 21 ok ==> 22 ok ==> 23 ok ==> 24 ok ==> 25 ok ==> 26 ok ==> 27 ok ==> 28 ok ==> 29 ok ==> 30 ok ==> 31 ok ==> 32 ok ==> 33 ok ==> 34 ok ==> 35 ok ==> 36 ok ==> 37 ok ==> 38 ok ==> 39 ok ==> 40 ok ==> 41 ok ==> 42 ok ==> 43 ok ==> 44 ok ==> 45 ok ==> 46 ok ==> 47 ok ==> 48 ok ==> 49 ok ==> 50 ok

本站 2 月 25 日消息，今日人工智能公司 Anthropic 宣布推出其首款“混合推理模型”——Claude 3.7 Sonnet。该模型可以解决更复杂的问题，并在数学和编码等领域中性能超过了以前的模型。

Anthropic公司表示，这是其有史以来“最智能”的 AI 模型，称这种“混合型”模型同时具备“推理模式”（停下来思考复杂答案）与传统模式（实时生成答案）的能力，并表示该模型是市面上唯一的此类“混合”模型。

本站注意到，除了新模型外，Anthropic 还发布了其“自主性”编程工具 Claude Code 的“有限研究预览版”。尽管 Anthropic 已经为如 Cursor 等人工智能编程工具提供支持，但此次推出的 Claude Code 被定位为一个“积极的合作伙伴”，它能够搜索和阅读代码、编辑文件、编写和运行测试、将代码提交到 GitHub，并使用命令行工具。

从本周一开始，用户可以在 Claude 应用程序中使用 Claude 3.7 Sonnet，开发者也可以通过 Anthropic 的 API、亚马逊 Bedrock 和谷歌云的 Vertix AI 获取该模型。其运行成本与前代产品 3.5 Sonnet 相同，输入每百万 token 收费 3 美元，输出每百万 token 收费 15 美元。

目前，OpenAI 等公司提供独立的推理模型，但 Anthropic 产品研究主管 Dianne Penn 表示，公司希望简化使用模型的体验。她指出：“我们从根本上认为，推理是人工智能的一个特征，而不是一个完全独立的事物。”她还提到，Claude 在回答简单问题如“现在几点了？”和应对更复杂的提示，例如“规划一个为期两周的意大利之旅，并考虑 3 月下旬的天气”时，回应速度差异不大。

Dianne Penn 称，Claude 3.7 Sonnet 在“自主性编程”、金融和法律任务上的表现明显优于前代产品。尽管该模型仍不具备实时网络搜索功能，但其知识截止日期为 2024 年 10 月，比其他模型更新。此外，Anthropic 还允许开发者通过其“草稿纸”功能指导模型的“思考”方式，甚至可以精确控制模型的响应时间。Anthropic 产品副总裁 Michael Gerstenhaber 表示：“有时开发者只需要明确指出，回答这个问题不应超过 200 毫秒。”他认为这是产品决策的一部分。

在 Anthropic 内部，员工已利用 Claude 3.7 Sonnet 完成前端网站设计、交互式游戏开发等任务。Penn 透露，该模型甚至能通过反复构建和编辑测试用例，支持长达 45 分钟的编码工作。她还提到，公司通过将模型的 API 映射到游戏控制器方案，测试模型在一款经典《宝可梦》电子游戏中的表现。结果显示，前代 Claude 3.5 Sonnet 无法走出游戏初期的帕雷特镇，而 3.7 版本成功击败了多个道馆馆主。

目前，Anthropic 凭借 Claude 3.7 Sonnet 的性能提升再次处于领先地位。该模型的发布也表明，行业正朝着一个模型能够完成所有任务的未来迈进，而非提供独立的推理模型。