Meta发布Llama 3 AI模型最大版本，宣称在语言和数学方面有所进步

2024年7月24日15:46:39

摘要

Meta发布了旗下Llama 3人工智能模型的最大版本（3.1），其多语言技能和一般性能指标紧随OpenAI等竞争对手的付费模型之后。

Meta表示，新款Llama 3型号支持八种语言，可编写更高质量的计算机代码，并能解决比以往版本更复杂的数学问题。

该算法拥有4050亿个参数或变量，可对用户查询做出响应，与去年发布的前一个版本相比，显得微不足道，但仍比竞争对手提供的领先模型要小。

相比之下，据报道，OpenAI GPT-4模型拥有1万亿个参数，而亚马逊正在准备一个拥有2万亿个参数的模型。

Meta首席执行官马克·扎克伯格正在多个渠道推广Llama 3，并表示预计未来Llama模型将在明年超越竞争对手。他表示，由这些模型驱动的Meta AI聊天机器人有望在今年年底成为最受欢迎的人工智能助手，目前已有数亿人在使用它。

目前，各大科技公司都在竞相证明，不断增长的资源密集型大型语言模型组合可以在高级推理等已知问题领域带来显著收益，以证明巨额投资是合理的。

Meta顶级人工智能科学家表示，此类模型将遭遇推理极限，并且需要借助其他类型的人工智能系统才能取得突破。

Meta表示，除了旗舰产品拥有4050亿参数模型，Meta还将发布于春季推出的更轻量级80 亿和700亿参数Llama 3模型的更新版本。

这三种新模型都支持多种语言，并可以通过扩展的“上下文窗口”处理更大的用户请求，Meta生成式AI负责人Ahmad Al-Dahle表示，这将改善生成计算机代码的体验。

“这是我们从社区得到的第一条反馈，”Al-Dahle在接受路透社采访时指出，更大的上下文窗口为模型提供了类似于更长的记忆，有助于处理多步骤请求。

另外，Al-Dahle表示，团队已经能够通过使用人工智能生成一些用于训练的数据来提高Llama 3模型在解决数学问题等任务上的表现。

Meta向开发者免费提供Llama模型，扎克伯格表示这一策略将带来回报，包括创新产品、减少对潜在竞争对手的依赖以及增加对公司核心社交网络的参与度。

如果开发者选择使用免费模式而非付费模式，Meta也将从中受益，这将削弱其竞争对手的商业模式。Meta在声明中宣称，其在关键数学和知识测试方面取得了进展，这可能会使这一前景更具吸引力。

尽管衡量人工智能发展的进展非常困难，但Meta测试结果似乎表明，其最大的Llama 3模型几乎匹敌甚至在某些情况下超越了Claude 3.5 Sonnet和GPT-4o，这两者被广泛认为是市场上最强大的两种前沿模型。

例如，在竞赛级数学应用题的MATH基准测试中，Meta模型得分为73.8，而GPT-4o的得分为76.6，Claude 3.5 Sonnet的得分为 71.1。

该模型在 MMLU上的得分为88.6，MMLU是一项涵盖数学、科学和人文学科数十个学科的基准机制，而GPT-4o的得分为88.7，Claude 3.5 Sonnet的得分为88.3。

另外，Meta研究人员还透露，即将于今年晚些时候推出的“多模式”模型版本将在核心Llama 3文本模型之上叠加图像、视频和语音功能。

Meta表示，早期实验表明，这些模型的表现可与Gemini 1.5和 Claude 3.5 Sonnet等其他多模式模型“媲美”。

7月

我的微信

这是我的微信扫一扫

登录 注册 找回密码