(原标题:Meta打造群众最大GPU集群,向上100000 个H100)
淌若您但愿不错频频碰头,接待标星储藏哦~
来源:实质详细自wired,谢谢。
本周早些时候,马克·扎克伯格在 Meta 财报电话会议上暗示,该公司正在“一个比 100,000 个 H100 AI GPU 更大的集群上考研 Llama 4 模子,或者比我见过的其他东谈主正在作念的任何报谈王人要大”。
天然这位 Facebook 创举东谈主莫得败露 Llama 4 不错作念什么,但《连线》杂志征引扎克伯格的话称,Llama 4 具有“新模式”、“更强的推理本事”和“更快的速率”。这是一个至关进击的发展,因为 Meta 正在与微软、谷歌和马斯克的 xAI等其他科技巨头竞争,以迷惑下一代东谈主工智能 LLM。
Meta 并不是第一家领有配备 10 万块 Nvidia H100 GPU 的 AI 考研集群的公司。埃隆·马斯克 (Elon Musk)于 7 月下旬脱手了一个近似限制的集群,称其为“计较超等工场”,并接洽将其限制翻倍至 20 万块 AI GPU。然而,Meta 本年早些时候暗示,预测到 2024 年底将领有向上 50 万块 H100 等效 AI GPU,因此它可能依然领有宽绰用于考研 Llama 4 的 AI GPU。
Meta 的 Llama 4 经受了一种专有的措施来迷惑 AI,因为它十足免费发布其 Llama 模子,允许其他洽商东谈主员、公司和组织在此基础上进行构建。这不同于 OpenAI 的 GPT-4o 和谷歌的 Gemini 等其他模子,这些模子只可通过 API 造访。然而,该公司仍然对 Llama 的许可证施加了收尾,举例收尾其买卖用途,而且不提供任何关系其考研格式的信息。尽管如斯,它的“开源”性质可能有助于它垄断 AI 的改日——咱们依然看到了这极少,中国基于开源代码构建的 AI 模子不错在基准测试中与 GPT-4o 和 Llama-3 相比好意思。
通盘这些计较本事王人带来了巨大的电力需求,尤其是单个当代 AI GPU每年最多会消耗 3.7MWh 的电力。这意味着 100,000 个 AI GPU 集群每年将至少消耗 370GWh 的电力——足以为向上 3400 万个粗豪好意思国度庭供电。这激励了东谈主们对这些公司如何找到如斯纷乱的供应的担忧,尤其是引入新的电源需要时刻。毕竟,就连扎克伯格本东谈主也暗示,电力收尾将收尾东谈主工智能的发展。
举例,埃隆·马斯克使用了几台大型移动发电机为位于孟菲斯的 10 万台计较机供电。谷歌的碳排放见解一直逾期,自 2019 年以来其温室气体排放量增多了48%。甚而前谷歌首席实验官也提议咱们应该消逝表象见解,让东谈主工智能公司负重致远,然后愚弄咱们迷惑的东谈主工智能技能来贬责表象危机。
然而,当一位分析师问 Meta 公司如何为如斯纷乱的计较集群供电时,Meta 高管遮掩了这个问题。另一方面,Meta 的东谈主工智能竞争敌手,如微软、谷歌、甲骨文和亚马逊,正在加入核能潮水。他们要么投资袖珍模块化响应堆,要么重启旧核电站,以确保他们有填塞的电力来复旧改日的发展。
天然这些需要时刻来迷惑和部署,但为东谈主工智能数据中心提供袖珍核电站将有助于收缩这些耗电集群对国度电网的职守。
“比任何东西王人大”的 GPU 集群
Meta 首席实验官马克·扎克伯格周三奠定了生成式 AI 考研的最新秀美,他暗示,该公司 Llama 模子的下一个主要版块将在一组“比以往任何报谈过的王人大”的 GPU 上进行考研。
扎克伯格在财报电话会议上告诉投资者和分析师,Llama 4 的迷惑弘扬顺利,预测将于明岁首初次推出。“咱们正在一个比 100,000 个 H100 更大的集群上考研 Llama 4 模子,或者说,比我所见过的其他东谈主正在作念的任何事王人要大,”扎克伯格说,他指的是用于考研 AI 系统的流行 Nvidia 芯片。“我预测较小的 Llama 4 模子将开始准备就绪。”
东谈主们宽绰以为,通过增多计较本事和数据来扩大 AI 考研限制是迷惑更苍劲的 AI 模子的要道。天然 Meta 现在似乎处于率先地位,但该鸿沟的大多数大公司可能王人在勉力使用领有向上 100,000 个先进芯片的计较集群。本年 3 月,Meta 和 Nvidia共享了用于迷惑Llama 3的约 25,000 个 H100集群的详备信息。7 月,埃隆·马斯克 (Elon Musk)吹嘘他的 xAI 联合企业已与 X 和 Nvidia 合营成就了 100,000 个 H100。“这是寰球上最苍劲的 AI 考研集群!”马斯克其时在 X 上写谈。
周三,扎克伯格终止败露关系 Llama 4 潜在先进功能的细节,但隐隐地提到了“新模式”、“更强的推理本事”和“速率更快”。
Meta 的 AI 措施在企业争夺主导地位的竞争中被评释是一张全能牌。Llama 模子不错免费下载,而 OpenAI、谷歌和大多数其他大公司迷惑的模子只可通过 API 造访。事实评释,Llama 至极受但愿十足限度其模子、数据和计较本钱的初创公司和洽商东谈主员的接待。
尽管 Meta 声称 Llama 是“开源”的,但 Llama 许可证如实对该模子的买卖用途施加了一些收尾。Meta 也莫得败露模子考研的细节,这收尾了外部东谈主员探究其使命旨趣的本事。该公司于 2023 年 7 月发布了 Llama 的第一个版块,并于本年 9 月推出了最新版块 Llama 3.2 。
治理如斯纷乱的芯片阵列来迷惑 Llama 4 可能会带来专有的工程挑战,并需要宽绰动力。Meta 高管周三遮掩了分析师对于好意思国部分地区动力获得收尾的问题,这些问题阻隔了公司迷惑更苍劲的东谈主工智能的勉力。
据算计,10 万块 H100 芯片构成的集群需要 150 兆瓦的电力。比较之下,好意思国最大的国度实验室超等计较机El Capitan需要 30 兆瓦的电力。Meta 预测本年将阔绰高达 400 亿好意思元的资金来装备数据中心和其他基础设施,比 2023 年增长 42% 以上。该公司预测来岁的开销将进一步大幅增长。
Meta 本年的总运营本钱增长了约 9%。但全体销售额(主要来自告白)增长了 22% 以上,尽管该公司为 Llama 技俩插足了数十亿好意思元,但利润率和利润额仍然更高。
与此同期,现在被以为是顶端东谈主工智能迷惑领军者的 OpenAI 尽管向迷惑者收取了使用其模子的用度,但仍在烧钱。现在仍是一家非渔利性企业,该公司暗示正在考研 GPT-5,这是现在复旧 ChatGPT 的模子的后继者。OpenAI 暗示,GPT-5 将比其前身更大,但并未败露用于考研的计较机集群。OpenAI 还暗示,除了限制以外,GPT-5 还将融入其他改换,包括最近迷惑的一种推理措施。
首席实验官 Sam Altman暗示,与前代居品比较,GPT-5 将“达成紧要飞跃”。上周,Altman 在 X 上回报了一篇新闻报谈,称 OpenAI 的下一个前沿模子将于 12 月发布, “假新闻失控了”。
谷歌首席实验官桑达尔·皮查伊 (Sundar Pichai) 周二暗示,该公司Gemini 系列生成式 AI 模子的最新版块正在迷惑中。
Meta 对 AI 的怒放气派巧合会引起争议。一些 AI 众人总结,免费提供功能苍劲得多的 AI 模子可能会很危急,因为它可能匡助犯科分子发动相聚膺惩或自动筹办化学或生物兵器。尽管 Llama 在发布之前过程了微调以收尾失当当作,但取消这些收尾相对来说并不贫乏。
尽管谷歌和 OpenAI 王人在扩充专有系统,扎克伯格仍然对开源战术抓乐不雅气派。“在我看来,开源将是最具本钱效益、可定制性、最值得相信、性能最高、最易于使用的迷惑者选项,”他周三暗示。“我很自重 Llama 在这方面处于率先地位。”
扎克伯格补充说,Llama 4 的新功能应该能够为 Meta 管事的更多功能提供复旧。如今,基于 Llama 模子的秀美性居品是近似 ChatGPT 的聊天机器东谈主 Meta AI,可在 Facebook、Instagram、WhatsApp 和其他应用格式中使用。
扎克伯格暗示,每月有向上 5 亿东谈主使用 Meta AI。跟着时刻的推移,Meta 预测将通过该功能中的告白产生收入。Meta 首席财务官 Susan Li 在周三的电话会议上暗示:“东谈主们使用它的查询范围将不休扩大,跟着咱们达成这一见解,盈利契机将跟着时刻的推移而存在。”有了告白收入的后劲,Meta 大略能够为其他通盘东谈主提供 Llama 补贴。
https://www.wired.com/story/meta-llama-ai-gpu-training/
半导体极品公众号保举
专注半导体鸿沟更多原创实质
护理群众半导体产业动向与趋势
*免责声明:本文由作家原创。著作实质系作家个东谈主不雅点,半导体行业不雅察转载仅为了传达一种不同的不雅点,不代表半导体行业不雅察对该不雅点赞同或复旧,淌若有任何异议,接待关系半导体行业不雅察。
今天是《半导体行业不雅察》为您共享的第3933实质,接待护理。
『半导体第一垂直媒体』
及时 专科 原创 深度
公众号ID:icbank
可爱咱们的实质就点“在看”共享给小伙伴哦