蒂莫西·莫拉诺
2024 年 10 月 23 日 01:31
Anthropic 推出了 Claude 3.5 Sonnet 和 Haiku 模型,具有改进的 AI 功能和计算机使用的公共测试版,增强了编码和工具使用任务。
据 anthropic.com 报道,著名人工智能公司 Anthropic 宣布发布升级版 Claude 3.5 Sonnet 和新模型 Claude 3.5 Haiku。 Claude 3.5 Sonnet 展示了显着的改进,特别是在编码方面,而 Claude 3.5 Haiku 在多个基准测试中的性能与他们之前最大的模型 Claude 3 Opus 的性能相匹配。
人工智能能力的进步
Claude 3.5 Sonnet模型展现了全面的升级,特别是在编码任务方面,它在该领域处于领先地位。它提高了 SWE-bench Verified 等行业基准的性能,从 33.4% 提高到 49.0%,超越了其他公开可用的模型。该模型还显示了代理工具使用任务的改进,在零售和航空领域都取得了显着的进步。
同样,Claude 3.5 Haiku 被定位为一种经济高效且快速的替代方案,在各种智能基准测试中超越了 Claude 3 Opus。它在编码任务方面尤其强大,在 SWE-bench Verified 上得分为 40.6%,优于多个最先进的模型。
在公共测试版中引入计算机使用
Anthropic 还在公开测试版中率先推出了一项名为“计算机使用”的新功能。此功能允许开发人员指示 Claude 像人类一样与计算机交互,包括移动光标和单击按钮等操作。虽然目前处于实验阶段,但它为自动化需要多个步骤的复杂任务开辟了新的可能性。 Replit 和 The Browser Company 等公司已经在为各种应用程序探索这些功能。
计算机使用功能可通过 Anthropic API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 实现。它为开发人员提供了一种新颖的方法来自动化重复流程并执行开放式任务,尽管它目前面临滚动和缩放等基本操作的挑战。
确保负责任的部署
为了确保这些新功能的安全部署,Anthropic 与美国人工智能安全研究所和英国安全研究所合作进行部署前测试。他们还开发了分类器来检测计算机使用功能的滥用,旨在降低垃圾邮件和错误信息等风险。
Anthropic 致力于不断改进这些模型和功能,预计未来几个月将取得快速进展。 Claude 3.5 Haiku 计划于本月晚些时候发布,最初是纯文本模型,并计划提供图像输入功能。
期待
这些发展预计将增强用户与人工智能交互的方式,为各个领域的自动化和个性化提供新的可能性。 Anthropic 邀请开发人员提供反馈,以进一步完善这些功能。
图片来源:Shutterstock
关键词:人工智能,加密,区块链,新闻