全国免费咨询:

13245491521

VR图标白色 VR图标黑色
X

中高端软件定制开发服务商

与我们取得联系

13245491521     13245491521

2023-09-23_老黄竟自曝万亿GPU霸主的「三无」策略

您的位置:首页 >> 新闻 >> 行业资讯

老黄竟自曝万亿GPU霸主的「三无」策略 来源:新智元仅在今年第二季度,英伟达就已经卖出了816吨H100! 假如这个速度不变,它有望在今年卖出3,266吨H100。并且,在接下来的每年里,英伟达都会卖出120万张H100。 现在,云服务供应商的大规模H100集群容量即将耗尽,全球陷入GPU短缺,硅谷大佬们都急了——整体算来,全球公司需要约432000张H100。 最近同时大火的,还有黄仁勋管理英伟达的方法。 「没有计划、没有汇报、没有层级」,如此随性,如此佛系,甚至可以说,如此疯狂。 就是这种管理办法,让英伟达市值超过1万亿,在半导体公司中一时风头无两。 半导体巨人 英伟达声称,在2024财年第二季度,他们售出了价值103亿美元的数据中心硬件。 价值103亿美元是什么概念? 今天,市场研究公司Omdia给出了让我们更容易理解的单位——816吨H100! 根据Omdia估计,第二季度英伟达的H100 GPU出货量超过了816吨。 一个英伟达H100 GPU,再加上散热器,平均重量超过了3公斤,因此,第二季度的H100发货量,保守估计也有30万个。 Omdia的估算准确吗? 要知道,H100有三种不同的外形尺寸,重量也不尽相同。 H100 PCIe显卡重达1.2千克,H100 SXM模组的重量尚不清楚,而带散热片的OAM模组重量可达2千克,它与H100 SXM的尺寸和TDP大致相同。 假设H100出货量80%是模组,20%是显卡,那么单个H100的平均重量应为1.84千克左右。 所以,Omida的估算可以认为大致准确。当然,实际重量可能少于816吨这个数字。 816吨是多重? 为了便于理解这个重量,我们可以拿以下这些东西来类比—— 4.5架波音747 11架航天飞机 181,818台PlayStation 5 32,727只金毛 假如英伟达在未来几个季度保持相同的GPU销量,那么它有望在今年售出3,266吨H100。 假如这个速度保持不变,每年英伟达都会卖出120万个H100。 并且,还不止这些。 还有H800,以及上一代的A100、A800、A30。 这样算的话,英伟达每季度实际销售的GPU数量远远高于30万个,重量总计远超过816吨。 即便如此,仍然不能满足全球的GPU荒——根据行业内部消息,英伟达H100 2023年的产量,早已销售一空,现在交钱订购,至少要到2024年中才能拿到货。 现在,H100早已一卡难求。 甚至还有外媒爆料:英伟达要在2024年,将H100的产量从今年的50万张左右直接提高到150-200万张。 显然,随着英伟达芯片在生成式AI的热潮中愈加紧俏,这个预测并不夸张。 黄仁勋「第一性原理」 与此同时,GPU的销量暴涨,也让英伟达成为了世界算力霸主,成功进入万亿美元俱乐部。 这背后离不开领导人黄仁勋的「疯狂式」的管理策略。 老黄表示,当你创立一家公司时,很自然地从第一性原理开始。 「就像我们正在建造一台机器如何运作一样,什么是输入,什么是输出,处在什么条件下,行业标准又是什么.....」 用老黄的话来说,英伟达的使命是,解决世界那些几乎不可能的计算问题。如果一个问题可以由普通的电脑解决,英伟达就会不做。 为了实现这一使命,英伟达吸引很多很多出色的人才,聚集在一起。 同时还需要,老黄管理这些人才的顶级策略,具体包括: 直接管理40名下属,没有1:1会议 英伟达不需要「金字塔」式的管理,而是将权力下放给每一个人。 老黄信奉扁平化的组织最富有能力,以便信息能够快速传播。 其中,组织的第一层——公司高层,就必须要考虑更加周全。他从不向任何人高管提供职业建议,因为管理团队中没有人来向他寻求职业建议。 「他们已经成功了,他们做得很好」。 另外,老黄从不进行1对1会议,所有事情都在小组讨论中进行。 「如果你有一个战略方向,为什么只告诉一个人?应该让每个人都知道」。 每个人都能随时了解所有情况 在公司内部,从来都不会召开副总裁会议、总监会议。 老黄称,自己参加的会议里,有来自不同组织的人,刚刚毕业的大学生,任何人都可以参加并发表意见。 不做状态报告,而是email「前五件事情」 在英伟达,每个人都不需要做状态报告,因为老黄认为这像是「元资讯」,太过精炼,基本上没有有益的讯息。 相反,公司里的任何人都可以通过电子邮件向他发送自己的「前五件事情」。 你所学到的,你所观察到的,你即将要做的,无论是什么事情,他每天早上都会阅读100+邮件,去了解大家的TOP 5 things。 比如,你去了一家非常棒的餐厅、有了一个可爱的baby...,这才是真正重要的信息。 没有正式的定期计划 对于,如何去做规划,让公司最底层的想法展现出来、让最好的工程师执行。 老黄表示,对于我来说,没有5年计划,也没有1年计划,会根据不断变化的业务和市场条件进行重新评估。 总结来说,英伟达优化组织结构的目的是:(1)吸引优秀人才;(2)保持尽可能小的团队规模;(3)使信息传播尽可能迅速 就连英伟达深度学习研究员VP Bryan Catanzaro,直接现身证明,全部为真。 那么,在这样的组织工作是一种什么样的体验? Bryan表示,在很多方面,这是一个非常稳定的环境。许多资深员工已经在英伟达工作了几十年。这种风格并不适合每一个人,但对很多人来说却很有效。这是一个充满活力的环境。 与马斯克不同的是,老黄很少对外讲述自己管理公司的方法。 今年在台大的演讲中,老黄曾讲述了定义了今天英伟达样貌的3个故事。这当中,离不开他的决策和判断,已经思考。 最初,英伟达与SEGA签约,为其打造游戏机。经过一年的开发过程,却发现使用的技术架构是错误的。 但是,黄仁勋发现即便纠正过来,也无济于事,因为这一产品创造与微软的Widows系统并不兼容。 于是,他联络了SEGA执行长,解释英伟达无法完成这个任务,并还得到了SEGA的帮助,所幸没有破产。 第二件事,就是2007年英伟达宣布的CUDA GPU加速计算技术。 为了向全世界推广CUDA技术,还专门创办了GTC的会议。经过多年努力,英伟达这项技术成为AI革命重要的推动引擎。 第三件事,做出放弃手机市场的艰难决定,将重心放在显卡上。 正如老黄所说,「战略性的撤退、牺牲、决定放弃什麽是成功的核心,非常关键的核心。」 一位X的工程师称,这一管理方式与马斯克X公司的操作非常类似。 还有网友戏称,老黄的这种管理方式,都可以在多模态智能体大模型体系中建模了。 如果老黄,能够像马斯克一样出一本传记,相信每个人都愿意去拜读一下。 看看,英伟达的GPU如何取得成功,成为大厂的掘金铲。 全球GPU缺口超40万张 H100的短缺,早就让硅谷大佬们都慌了! Sam Altman就曾自曝,GPU已经告急,希望用ChatGPT的用户能少一点。?? 「GPU非常短缺,使用我们产品的人越少越好」 Altman表示,受GPU限制,OpenAI已经推迟了多项短期计划(微调、专用容量、32k上下文窗口、多模态)。 OpenAI联合创始人兼职科学家Andrej Karpathy也透露过,现在谁家得到了多少块H100,都是硅谷的顶级八卦。 这张在社区广为流传的图曾做出如下估算—— -GPT-4可能在大约10000-25000张A100上进行了训练 -Meta大约21000 A100 -Tesla大约7000 A100 -Stability AI大约5000 A100 -Falcon-40B在384个A100上进行了训练 – Inflection使用了3500和H100,来训练与GPT-3.5能力相当的模型 现在不光是科技公司排着队购买H100,连沙特阿拉伯和阿联酋都出手了,一下就买了几千个H100 GPU。 马斯克直言,现在想买到H100已经难如登天。 根据马斯克的说法,GPT-5可能需要30000-50000个H100。此前,摩根士丹利曾表示GPT-5使用25000个GPU,自2月以来已经开始训练,不过Sam Altman之后澄清了GPT-5尚未进行训。 而一篇名为「Nvidia H100 GPU:供需」文章曾推测,小型和大型云提供商的大规模H100集群容量即将耗尽,H100的需求趋势至少会持续到2024年底。 微软的年报中也向投资者强调,GPU是其云业务快速增长的「关键原材料」。如果无法获得所需的基础设施,可能会出现数据中心中断的风险因素。 据推测,OpenAI可能需要50000个H100,而Inflection需要22,000个,Meta可能需要 25k,而大型云服务商可能需要30k(比如Azure、Google Cloud、AWS、Oracle)。 Lambda和CoreWeave以及其他私有云可能总共需要100k。Anthropic、Helsing、Mistral和Character可能各需要10k。 整体算来,全球公司需要约432000张H100。按每个H100约35k美元来计算,GPU总需求耗资150亿美元。 这其中,还不包括国内大量需要H800的互联网公司。 而且,H100不光不愁卖,利润率还高得吓人。 业内专家曾称,英伟达H100的利润率接近1000%。 参考资料:https://twitter.com/danhockenmaier/status/1701608618087571787https://www.tomshardware.com/news/nvidia-sold-900-tons-of-h100-gpus-last-quarter推荐阅读 西电IEEE Fellow团队出品!最新《Transformer视觉表征学习全面综述》润了!大龄码农从北京到荷兰的躺平生活(文末有福利哟!)如何做好科研?这份《科研阅读、写作与报告》PPT,手把手教你做科研奖金675万!3位科学家,斩获“中国诺贝尔奖”!又一名视觉大牛从大厂离开!阿里达摩院 XR 实验室负责人谭平离职 最新 2022「深度学习视觉注意力 」研究概述,包括50种注意力机制和方法!【重磅】斯坦福李飞飞《注意力与Transformer》总结,84页ppt开放下载!2021李宏毅老师最新40节机器学习课程!附课件+视频资料 欢迎大家加入DLer-计算机视觉技术交流群! 大家好,群里会第一时间发布计算机视觉方向的前沿论文解读和交流分享,主要方向有:图像分类、Transformer、目标检测、目标跟踪、点云与语义分割、GAN、超分辨率、人脸检测与识别、动作行为与时空运动、模型压缩和量化剪枝、迁移学习、人体姿态估计等内容。 进群请备注:研究方向+学校/公司+昵称(如图像分类+上交+小明) ??长按识别,邀请您进群!

上一篇:2020-10-30_SOTA论文也未必能被接收,谷歌科学家Eric Jang谈顶会审稿标准 下一篇:2025-05-14_字节最强多模态模型登陆火山引擎!Seed1.5-VL靠20B激活参数狂揽38项SOTA

TAG标签:

20
网站开发网络凭借多年的网站建设经验,坚持以“帮助中小企业实现网络营销化”为宗旨,累计为4000多家客户提供品质建站服务,得到了客户的一致好评。如果您有网站建设网站改版域名注册主机空间手机网站建设网站备案等方面的需求...
请立即点击咨询我们或拨打咨询热线:13245491521 13245491521 ,我们会详细为你一一解答你心中的疑难。
项目经理在线

相关阅读 更多>>

猜您喜欢更多>>

我们已经准备好了,你呢?
2022我们与您携手共赢,为您的企业营销保驾护航!

不达标就退款

高性价比建站

免费网站代备案

1对1原创设计服务

7×24小时售后支持

 

全国免费咨询:

13245491521

业务咨询:13245491521 / 13245491521

节假值班:13245491521()

联系地址:

Copyright © 2019-2025      ICP备案:沪ICP备19027192号-6 法律顾问:律师XXX支持

在线
客服

技术在线服务时间:9:00-20:00

在网站开发,您对接的直接是技术员,而非客服传话!

电话
咨询

13245491521
7*24小时客服热线

13245491521
项目经理手机

微信
咨询

加微信获取报价