Anthropic 推出具有新计算机使用功能的 Claude 3.5 Sonnet 和 Haiku 模型

蒂莫西·莫拉诺
2024 年 10 月 23 日 01:31

Anthropic 推出了 Claude 3.5 Sonnet 和 Haiku 模型，具有改进的 AI 功能和计算机使用的公共测试版，增强了编码和工具使用任务。

据 anthropic.com 报道，著名人工智能公司 Anthropic 宣布发布升级版 Claude 3.5 Sonnet 和新模型 Claude 3.5 Haiku。 Claude 3.5 Sonnet 展示了显着的改进，特别是在编码方面，而 Claude 3.5 Haiku 在多个基准测试中的性能与他们之前最大的模型 Claude 3 Opus 的性能相匹配。

人工智能能力的进步

Claude 3.5 Sonnet模型展现了全面的升级，特别是在编码任务方面，它在该领域处于领先地位。它提高了 SWE-bench Verified 等行业基准的性能，从 33.4% 提高到 49.0%，超越了其他公开可用的模型。该模型还显示了代理工具使用任务的改进，在零售和航空领域都取得了显着的进步。

同样，Claude 3.5 Haiku 被定位为一种经济高效且快速的替代方案，在各种智能基准测试中超越了 Claude 3 Opus。它在编码任务方面尤其强大，在 SWE-bench Verified 上得分为 40.6%，优于多个最先进的模型。

在公共测试版中引入计算机使用

Anthropic 还在公开测试版中率先推出了一项名为“计算机使用”的新功能。此功能允许开发人员指示 Claude 像人类一样与计算机交互，包括移动光标和单击按钮等操作。虽然目前处于实验阶段，但它为自动化需要多个步骤的复杂任务开辟了新的可能性。 Replit 和 The Browser Company 等公司已经在为各种应用程序探索这些功能。

计算机使用功能可通过 Anthropic API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 实现。它为开发人员提供了一种新颖的方法来自动化重复流程并执行开放式任务，尽管它目前面临滚动和缩放等基本操作的挑战。

确保负责任的部署

为了确保这些新功能的安全部署，Anthropic 与美国人工智能安全研究所和英国安全研究所合作进行部署前测试。他们还开发了分类器来检测计算机使用功能的滥用，旨在降低垃圾邮件和错误信息等风险。

Anthropic 致力于不断改进这些模型和功能，预计未来几个月将取得快速进展。 Claude 3.5 Haiku 计划于本月晚些时候发布，最初是纯文本模型，并计划提供图像输入功能。

期待

这些发展预计将增强用户与人工智能交互的方式，为各个领域的自动化和个性化提供新的可能性。 Anthropic 邀请开发人员提供反馈，以进一步完善这些功能。

图片来源：Shutterstock

关键词：人工智能,加密,区块链,新闻

Anthropic 推出具有新计算机使用功能的 Claude 3.5 Sonnet 和 Haiku 模型

人工智能能力的进步

在公共测试版中引入计算机使用

确保负责任的部署

期待

Related Posts

死于坠机事故的飞行员试图避免在跑道上乌龟：NPR

购房者的下跌付款在两年内首次缩水，即使价格上涨

Velorishop重新定义了优质产品品种和客户优先服务的在线购物体验 – 区块链新闻网站

就像乔治·W·布什（George W Bush）在伊拉克所做的一样，如果以色列闯入伊朗，它将最终拥有可能随之而来的混乱|世界新闻

如果华盛顿加入伊朗罢工，霍蒂斯威胁我们船只

刚果将钴出口禁令延长了三个月以遏制供应

股东通知：Faruqi＆Faruqi，LLP代表Organon的投资者调查索赔