设为首页|收藏本站|
开启左侧

[科技] Meta发布新版Llama 3模型:支持8种语言对话,能解决更难的数学问题

[复制链接]
56239 0
啊潘 发表于 2024-7-23 23:32:02 | 只看该作者 打印 上一主题 下一主题
 
划重点:

Meta发布新版Llama 3模型:支持8种语言对话,能解决更难的数学问题 第1张图片


腾讯科技讯 7月23日消息,据国外媒体报道,Facebook母公司Meta在周二推出了其大语言模型“Llama”的最新免费版本,主打多语言技能和通用性能指标,紧随OpenAI等竞争对手的付费模型之后。
该公司公告显示,全新的Llama 3.1模型可以进行八种语言的对话,编写更高质量的计算机代码,并可以解决更复杂的数学问题。该模型拥有4050亿个参数(即算法为生成对用户查询的响应而考虑的变量)远远超过了去年发布的先前版本,但仍然小于竞争对手的领先模型。据报道,OpenAI的GPT-4模型有1万亿个参数,亚马逊正在投资一个有2万亿个参数的模型。此外,Meta还将发布拥有80亿和700亿参数的轻量级Llama 3模型的新版本。
Meta宣称,Llama 3.1的智能和实用性与OpenAI、Google和Anthropic等公司的最佳商业产品不相上下。在衡量人工智能进步的某些基准测试中,Meta甚至声称该模型是目前地球上最聪明的人工智能模型。“这确实令人激动,”专注于追踪开源人工智能进展的斯坦福大学的副教授珀西·梁(Percy Liang)评价说。他认为,如果开发者们发现Meta的新模型与行业领军产品,例如OpenAI的GPT-4o一样具备同等能力,这可能会促使许多人转向Meta的产品。“观察使用模型的转变将是一件非常有趣的事情,”他补充道。
虽然Meta尚未公布开发Llama 3.1的具体成本,但公司首席执行官马克·扎克伯格(Mark Zuckerberg)最近向投资者透露,Meta在人工智能研发上的投入已经达到了数十亿美元的规模。继续发布最先进的免费大语言模型,这一决策不仅体现了Meta在技术上追求卓越的决心,也展现了其在商业模式上的创新精神,致力于通过开源策略促进人工智能技术的普及和进一步发展。
Llama 3.1的最新版本让人工智能技术变得更加易于获取和定制化,但同时也可能激发公众对在缺乏适当监管的情况下推广此类技术的潜在风险的讨论。目前,大多数科技界领袖正致力于将人工智能技术商业化,而扎克伯格却选择了一条不同的道路:他决定无偿向公众提供Meta开发的这一尖端人工智能模型。这一举措可能会改变人工智能技术的市场格局,同时也为整个行业带来了新的思考和挑战。
全力支持开源模型

Meta通过发布Llama 3.1向全世界表明,大多数人工智能公司所采用的闭源开发模式并非唯一的人工智能发展路径。然而,该公司也让自己处于关于在缺乏控制机制的情况下推广人工智能可能带来的风险的辩论核心。Meta通过特殊训练方法,让Llama模型在默认情况下不会生成有害的生成内容,但这种模型可以微调来移除安全措施。
在新模型发布时,扎克伯格发布了一封公开信,他在信中将Llama模型比作开源的Linux操作系统。回顾历史,当Linux在20世纪90年代末期至本世纪初开始流行时,许多大型科技公司都倾向于投资于封闭的操作系统,并曾对开源软件的安全性和可靠性持怀疑态度。然而,时至今日,Linux已成为云计算领域的基石,并在Android移动操作系统中扮演着核心角色。
Meta发布新版Llama 3模型:支持8种语言对话,能解决更难的数学问题 第2张图片


扎克伯格在信中进一步指出:“我坚信,人工智能的发展也将遵循这一趋势。目前,虽然一些科技公司仍在开发领先的封闭模型,但开源技术正在迅速迎头赶上,缩小与这些封闭模型之间的差距。”这表明Meta公司对于开源AI模型的发展前景充满信心,并期待其在未来的人工智能领域发挥重要作用。
然而,Meta免费开放其人工智能技术并非完全无私。先前的Llama版本已经助力Meta在人工智能研究者、开发者和初创公司中赢得了重要地位。斯坦福大学的珀西·梁还指出,Llama 3.1并不完全符合开源精神,因为Meta对其应用施加了限制,比如限制了模型在商业产品中可应用的规模。
Llama 3.1因其庞大的体量,无法在常规计算机上运行,但Meta透露,包括Databricks、Groq、亚马逊云计算服务AWS和谷歌云(Google Cloud)在内的多家云服务供应商将提供托管服务,以便开发者能够执行该模型的定制版本。此外,用户还可以通过Meta.ai平台访问该模型。
对AI发展产生深远影响

一些开发者认为,Llama的新版本对人工智能的发展可能具有深远的影响。致力于开源人工智能项目的组织EleutherAI的执行董事斯特拉·比德曼(Stella Biderman)指出,Llama 3并不完全遵循开源原则。不过他强调,Meta最新的许可证调整,将允许开发者利用Llama 3训练自己的模型,这是目前大多数人工智能公司都不准许的事情。他说:“这确实是一个极其重大的进步。”
与OpenAI和谷歌的尖端模型不同,Llama并不具备“多模态”特性,也就是说,它没有被设计来同时处理图像、音频和视频。不过Meta宣称,Llama在使用其他软件,例如网络浏览器方面,有着显著的优势,这一点被众多研究人员和企业认为可能会大幅提升人工智能的实用性。
2022年末,OpenAI推出ChatGPT之后,部分人工智能领域的专家出于对人工智能技术可能被滥用或过于强大难以驾驭的担忧,呼吁暂停人工智能的发展。虽然这种对存在风险的担忧已经有所缓和,但许多专家依然对不受限制的人工智能模型可能被黑客利用或加速生物和化学武器研发表示忧虑。“世界各地的网络犯罪分子对此将会感到非常兴奋,”图灵奖得主、人工智能教父杰弗里·辛顿(Geoffrey Hinton)评论道,他在机器学习领域的基础性工作为大型语言模型的发展奠定了基石。
辛顿自2013年起加入谷歌,但在去年离职,以便公开讨论更先进的人工智能模型可能带来的潜在风险。他指出,人工智能与开源软件本质上不同,因为模型无法像软件那样接受同样的审查。他补充说:“人们根据自己的目的微调模型,而这些目的中有些可能是非常恶劣的。”
Meta通过谨慎推出Llama的早期版本,帮助平息了部分担忧。该公司声称,在发布前会对Llama进行严格的安全性测试,并表示几乎没有迹象显示其模型会简化武器的开发过程。Meta还表示,将推出一些新工具,帮助开发者通过调节模型内容生成来确保Llama模型的安全。该发言人乔恩·卡维尔(Jon Carvill)表示,该公司会根据具体情况决定是否发布未来的模型。(编译/无忌)


上一篇:BLG2-1击败WBG,拿下第4胜!下路直接打穿,bin疯狂单带
下一篇:万亿税收,来了!
@



1.西兔生活网 CTLIVES 内容全部来自网络;
2.版权归原网站或原作者所有;
3.内容与本站立场无关;
4.若涉及侵权或有疑义,请点击“举报”按钮,其他联系方式或无法及时处理。
 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

排行榜
活跃网友
返回顶部快速回复上一主题下一主题返回列表APP下载手机访问
Copyright © 2016-2028 CTLIVES.COM All Rights Reserved.  西兔生活网  小黑屋| GMT+8, 2024-9-7 12:19