设为首页|收藏本站|
开启左侧

[科技] OpenAI把微软电网搞崩!GPT-6被曝25年发布,训练刷爆10万张H100

[复制链接]
81766 10
闪亮光速 发表于 2024-3-27 13:14:40 | 只看该作者 打印 上一主题 下一主题
 
OpenAI把微软电网搞崩!GPT-6被曝25年发布,训练刷爆10万张H100 第1张图片



  新智元报道  

编辑:编辑部
【新智元导读】GPT-5还未发布,GPT-6已经在路上了?微软工程师曝出,为GPT-6搭建10万个H100训练集群,整个电网却被搞崩。通往AGI大关,还需要破解电力难题。


GPT-6也被电力卡脖子了——部署十万个H100时,整个电网发生了崩溃!

就在刚刚,微软工程师爆料,10万个H100基建正在紧锣密鼓地建设中,目的就是训练GPT-6。
微软工程师吐槽说,团队在部署跨区域GPU间的infiniband级别链接时遇到了困难。
Corbitt:为何不考虑直接将所有设备部署在同一个地区呢?


微软工程师:这确实是我们最初的方案。但问题是,一旦我们在同一个州部署超过100,000个H100 GPU,电网就会因无法负荷而崩溃。
OpenAI把微软电网搞崩!GPT-6被曝25年发布,训练刷爆10万张H100 第2张图片

这是创业者Kyle Corbitt在社交媒体上,分享自己与一位微软工程师关于GPT-6训练集群项目的对话

没想到,GPT-5还没发,微软就已悄悄为OpenAI开始训练GPT-6了。
同在今天,一张「OpenAI内部时间线」图片在网上疯转。
图中清晰标注出:OpenAI早在2022年8月-10月之间开始了GPT-5(代号Arrakis)的训练,2023年4月GPT-4.5(代号Gobi)在训练中。
OpenAI把微软电网搞崩!GPT-6被曝25年发布,训练刷爆10万张H100 第3张图片


并且图中显示,GPT-6的测试,预计早在去年9月就开始了!
同时,关于GPT-5(Arrakis)的一个爆料帖,也随之浮出水面。
太长不看版


贴中爆出许多内幕消息。
比如,GPT-4.5因为能力不够,干脆被跳过,所以今年OpenAI会直接发GPT-5。
另外还有若干未经证实的消息(从上图中也可以看出),关于OpenAI手中握着的一大把模型——
比如,Arrakis/GPT-5在GPT-4不久后训练了3个月,于22年10月结束;在GPT-5之后,GPT-4.5于23年4月完成训练。
最劲爆的消息当然就是,现在GPT-6或许已经在训练中了。
OpenAI把微软电网搞崩!GPT-6被曝25年发布,训练刷爆10万张H100 第4张图片


但是,GPT-5并不是AGI,因为无法解决「量子引力」问题。同理,GPT-6也不是AGI。
接下来,让我们一一盘点下,帖子中都有哪些信息点。
最接近AGI的模型,与人类专家不相上下


去年8月,FeltSteam最先曝出OpenAI内部正在进行一个Arrakis多模态模型的项目,远超GPT-4,非常接近AGI。
Arrakis项目被首次提及,是名叫FeltSteam的网友最先在Reddit一个评论区中爆料称,「Arrakis和Gobi都很酷」。
OpenAI把微软电网搞崩!GPT-6被曝25年发布,训练刷爆10万张H100 第5张图片


并且,他在r/singularity板块中另一个问题下, 介绍了Arrakis的一些能力。
他提到,「这是一个无所不能的模型,可以输入文本、图像、音频和视频的任何组合」。
具体来说,Arrakis更多的细节包括:
- 多模态模型
- 性能远超GPT-4
- 接近AGI
- 幻觉发生率明显低于GPT-4
- Altman正试图将Arrakis作为一种工具来推销,尽管它是有感情的
- 推理成本略低于GPT-4
- 非常优秀的自主智能体
- 训练一般数据是合成的
OpenAI把微软电网搞崩!GPT-6被曝25年发布,训练刷爆10万张H100 第6张图片


与此同时,Jimmy Apples在社交媒体上曝出了OpenAI内部代号Gobi的项目——大规模多模态模型。
除了以上两个项目,一个代号名为「Sunshine」的项目逐渐浮出水面。
OpenAI把微软电网搞崩!GPT-6被曝25年发布,训练刷爆10万张H100 第7张图片


OpenAI这些秘密进行的项目,一时间引来许多网友的猜测和讨论。
随后,FeltSteam又爆出了更多的细节,Arrakis据称有125万亿参数,大约是GPT-4的100倍,并在2022年10月完成训练。
值得一提的是,Arrakis不是通过计算资源实现的,而是通过提高计算效率实现的。
目前,OpenAI内部也在使用Arrakis进行研究,不过整体员工水平肯定优于Arrakis。另外,与GPT-5相比,Gobi更接近GPT-4.5。
到了10月,FeltSteam再一次表示,一个比GPT-4大100倍的模型即将问世。
GPT-5将在2024年年中,或在2024年第三季度发布。
最近BussinessInsider的报道称,知情人士透露,GPT-5或将在今年夏天发布。与FeltSteam预测的时间几乎吻合。
而Arrakis是GPT-5一个更强大的候选者,在多个领域具备人类水平的专业知识能力。
GPT-5不是AGI


不过,Arrakis并不符合Altman对AGI的定义,即解决「量子引力」的问题。
OpenAI把微软电网搞崩!GPT-6被曝25年发布,训练刷爆10万张H100 第8张图片

量子引力,又称量子重力,是描述对重力场进行量子化的理论,属于万有理论之一隅;主要尝试结合广义相对论与量子力学,为当前物理学尚未解决的问题

但正如之前所说,Arrakis模型还是能够达到人类专家水平。
GPT-5和GPT-6都不是AGI

FeltSteam表示,传说中的AGI,是Arrakis以外的东西。
但是,为什么我们能在这么短的时间里,训练出一个125万亿参数的模型呢?
理论上来说,如果训一个1.75万亿参数模型需要4-5个月,那么如果训练一个大百倍的模型,应该需要几十年。
(目前已知,GPT-4在A100集群上训了100天,但是在训练之后,OpenAI又花了几个月时间对它微调和对齐。)
OpenAI把微软电网搞崩!GPT-6被曝25年发布,训练刷爆10万张H100 第9张图片


显然,要训125万亿参数的模型,不仅要投入原始计算资源,还要显著提高计算效率。
用90%合成数据训练


另一个比较值得关注的信息是,据称Arrakis去年训练的数据集中约90%是合成数据。
此前,外媒报道称:
Ilya Sutskever的突破让OpenAI克服了在获取高质量数据以训练新模型方面的限制,而这正是开发下一代模型的主要障碍。这项研究涉及使用计算机生成的数据,而不是真实世界的数据,如从互联网上提取的文本或图像来训练新模型。
OpenAI把微软电网搞崩!GPT-6被曝25年发布,训练刷爆10万张H100 第10张图片


FeltSteam认为,OpenAI正遇到了扩展(scaling)的难题,因为仅仅扩展注意力和模型参数是远远不够的。
目前,GPT-4的训练已经穷尽了整个互联网的数据,还需要进行强化学习,甚至更多的数据。
另外,Arrakis还是一个非常出色的自主智能体。
OpenAI把微软电网搞崩!GPT-6被曝25年发布,训练刷爆10万张H100 第11张图片


所有关于OpenAI项目信息汇总目录一览表。
OpenAI把微软电网搞崩!GPT-6被曝25年发布,训练刷爆10万张H100 第12张图片


十万个H100训GPT-6,被电力卡脖子


就在以上的爆料帖中,有一种说法是,GPT-6将于2025年发布。
OpenAI把微软电网搞崩!GPT-6被曝25年发布,训练刷爆10万张H100 第13张图片


而就在爆料微软工程师对话的帖子中,也再次证实:微软正用10万个H100来帮OpenAI训练GPT-6!
OpenAI把微软电网搞崩!GPT-6被曝25年发布,训练刷爆10万张H100 第14张图片


有网友算了一下,如果十万个H100同时开启,功耗将达到70兆瓦,电网肯定撑不住。
OpenAI把微软电网搞崩!GPT-6被曝25年发布,训练刷爆10万张H100 第15张图片


而熟悉电力行业的网友说,一般大型电厂的输出功率将达到2000兆瓦,100兆瓦的负载其实并不大。但是突然在电网中增加100兆瓦的负载肯定会让电网系统出问题。
OpenAI把微软电网搞崩!GPT-6被曝25年发布,训练刷爆10万张H100 第16张图片


核能也许是唯一的办法了,电力短缺将直接限制未来GPU的发展。
OpenAI把微软电网搞崩!GPT-6被曝25年发布,训练刷爆10万张H100 第17张图片


此前,ChatGPT每天耗电已超50万千瓦时,登上了热搜,足见AI「吃电」非常凶猛。
根据波士顿咨询集团的分析,到2030年,数据中心的用电量预计将增加两倍,相当于为大约4000万美国家庭供电所需的电力量

没想到,马斯克预言的由AI导致的电力短缺,这么快就卡住AGI的脖子了。
OpenAI把微软电网搞崩!GPT-6被曝25年发布,训练刷爆10万张H100 第18张图片

马斯克:「现在AI对算力的需求差不多每半年就会增加10倍,马上会超过宇宙的质量。芯片短缺缓解后,马上就会出现电力短缺。如果电网输出100-300千伏的电压,然后必须一路降压至6伏,未来会出现变压器短缺」。

包括Sam Altman在内的越来越多的AI行业大佬表示,AI的第一性原理,最重要的部分就是能源和智能的转化率的问题。
人工智能是能源的无底洞,AI未来将会被能源卡脖子。
因为Transformer本质上不是一个能效很高的算法,所以在未来,能源将会是困扰AI发展的一个大问题。
OpenAI把微软电网搞崩!GPT-6被曝25年发布,训练刷爆10万张H100 第19张图片


对此,网友们表示,长期看好中国基建。
而在Altman看来,满足AI飙升能源需求的最有效方法,就是核聚变。
OpenAI把微软电网搞崩!GPT-6被曝25年发布,训练刷爆10万张H100 第20张图片


为此,他本人就在核聚变上投资了真金白银的数亿美元。
没有突破,就没有办法到达那里,我们需要核聚变。
然而,真要达成核聚变,却没那么快。
英国曼彻斯特大学核聚变研究员Aneeqa Khan表示,“在地球上重建太阳中心的条件是一个巨大的挑战”,可能要到本世纪下半叶才能准备就绪。
「核聚变已经为时已晚,无法应对气候危机。在短期内,我们可利用的是现有的低碳技术,比如裂变和可再生能源」。
国际能源署(IEA)最近的一项分析计算出,数据中心、某货和人工智能的电力消耗在未来两年内可能会翻一番。2022年,它们约占全球电力需求的2%。同时AI的需求将呈指数级增长,在2023年至2026年间至少增长10倍

此外,除了电力的限制之外,网友还继续脑洞大开,认为散热也将成为一个问题。
OpenAI把微软电网搞崩!GPT-6被曝25年发布,训练刷爆10万张H100 第21张图片


10万块H100还会带来散热和空间堆叠的问题,其实最近3年这些问题一直都存在,未来还会越来越严重。
网友进一步调侃到,未来加拿大会成为AI大国,因为他们有取之不尽的寒冷且干燥的空气!这些在AI时代将会是宝贵的自然资源。


参考资料:
https://x.com/ai_for_success/status/1772701538705617167?s=20

https://twitter.com/ai_for_success/status/1772492362872168656?t=VDn6nXceeqOAuRZYi58vgA&s=19


上一篇:难以置信!全AI生成美女视频,46秒逼真神态骗过所有人
下一篇:10部惨遭禁播的热播剧,《延禧攻略》最可惜,你看过几部?
@



1.西兔生活网 CTLIVES 内容全部来自网络;
2.版权归原网站或原作者所有;
3.内容与本站立场无关;
4.若涉及侵权或有疑义,请点击“举报”按钮,其他联系方式或无法及时处理。
 

精彩评论10

正序浏览
跳转到指定楼层
沙发
郭兴祥 发表于 2024-3-27 15:35:33 | 只看该作者
 
建个核电站喂它
回复 支持 反对

使用道具 举报

 
板凳
石岚 发表于 2024-3-27 16:47:46 | 只看该作者
 
只能感慨,又有钱又没有限购,真的是大力出奇迹啊……
回复 支持 反对

使用道具 举报

 
地板
天道林 发表于 2024-3-27 17:04:33 | 只看该作者
 
有没有可能是电子时代已经发展到瓶颈,需要等待新的技术突破,替代电子。
回复 支持 反对

使用道具 举报

 
5#
别来烦我 发表于 2024-3-27 17:40:57 | 只看该作者
 
可能未来真嘚“核电站+量子超算+自迭代通用人工智能” 才能有效运行……[哭笑]
回复 支持 反对

使用道具 举报

 
6#
鸽也有爱 发表于 2024-3-27 17:41:44 | 只看该作者
 
要建立自己的发电站了,柴油发电机组群+配电站+储能系统群。钱💰到位,立马给安排。[哭笑]
回复 支持 反对

使用道具 举报

 
7#
逺匚 发表于 2024-3-27 17:42:56 | 只看该作者
 
算力中心建核电站旁边也是个好选择,核电站周边地价本来就便宜。有核电站的州还会给补贴。
回复 支持 反对

使用道具 举报

 
8#
文尧 发表于 2024-3-27 18:55:19 | 只看该作者
 
咋不算算有啥办法省电啊[哭笑][哭笑][哭笑]
回复 支持 反对

使用道具 举报

 
9#
失去的青春 发表于 2024-3-27 21:30:37 | 只看该作者
 
大模型Ai其实是外星人瓦解地球能量的陷阱
回复 支持 反对

使用道具 举报

 
10#
疯狂的欢乐马 发表于 2024-3-28 07:14:46 | 只看该作者
 
这种所谓智能怎么跟人类智能比,完全就是算,人类的大脑才耗费多少能量
回复 支持 反对

使用道具 举报

 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

排行榜
活跃网友
返回顶部快速回复上一主题下一主题返回列表APP下载手机访问
Copyright © 2016-2028 CTLIVES.COM All Rights Reserved.  西兔生活网  小黑屋| GMT+8, 2024-6-28 06:03