跟着东说念主工智能的加快发展伪娘 人妖,科技巨头之间掀翻了一轮轮 AI 算力竞赛。日前,马斯克的 xAI 集群数据曝光,其正在推出基于 10 万个 H100 GPU 的 Colossus 检会集群。Meta 也缠绵购买 35 万个 H100 GPU,加强 Llama 4 AI 模子的算力。LessWrong 网站对几大 AI 巨头的 GPU/TPU 数目进行估算,权衡到 2025 年,微软、谷歌、Meta、亚马逊和 xAI 所领有 GPU 的等效 H100 数目将跨越 1240 万块。这标明科技巨头间的算力"武备竞赛"仍在延续。
超 1240 万块,巨头无间布局算力河山
最近,LessWrong 网站上发表了一篇博客,把柄公开数据对英伟达芯片的产量、几大 AI 巨头的 GPU/TPU 数目进行了估算。其中,微软领有 75 万 -90 万块等效 H100,来岁权衡达到 250 万 -310 万块;谷歌领有 100 万 -150 万块等效 H100,来岁权衡达到 350 万 -420 万块;Meta 领有 55 万 -65 万块等效 H100,来岁权衡达到 190 万 -250 万块;亚马逊领有 25 万 -40 万块等效 H100,来岁权衡达到 130 万 -160 万块;xAI 领有 10 万块等效 H100,来岁权衡达到 55 万 -100 万块。
不错看出,几大科技巨头齐在紧锣密饱读地布局我方的算力河山,开展下一代更先进模子的检会。马斯克此前即显现 Grok 3 将在年底前亮相。他默示,在法律问题数据集上完成检会后,下一代 Grok 3 将是一个建壮的私东说念主讼师,能全天候提供管事。谷歌 Gemini 2.0 权衡在本月认真上线。OpenAI 更是文书,将开启为期 12 天的" Shipmas "新功能、新址品和演示行为,将展示文本转视频 AI 器具 Sora、新的推理模子等。
这些先进模子的检会和推理需要精深的算力资源。马斯克宣称,其 Colossus 集群是"寰宇上最建壮的东说念主工智能检会系统"。集群配备英伟达 HGX H100 管事器,每台管事器内含 8 张 H100 GPU,每个机架可容纳 8 台管事器,8 台管事器构成 1 个阵列,每个阵列有 512 个 GPU,所有 Colossus 集群内有跨越 1500 个 GPU 机架,维持着精深的算力运行。
Meta 也在使用跨越 10 万个 Nvidia H100 GPU 的集群,检会其最新 Llama 4 AI 模子,成为现在领域最大的 AI 检会集群之一。来岁 Meta 可能会使用 35 万个 H100 GPU。至于 OpenAI,其背后维持者微软很可能是英伟达近两年的最大客户。据 Omdia Research 分析,2023 年微软和 Meta 是 H100 的最大买家,权衡采购量达到 15 万个。而到了 2024 年,微软的 AI 芯片囤货主见更是晋升到了惊东说念主的 180 万块,其中大部分来自英伟达。
英伟达无间启程点伪娘 人妖,定制芯片市场值得调治
在 AI 巨头无间大领域部署 AI 算力的情况下,预测 2025 年 AI 芯片市场,英伟达行动巨匠 AI 芯片市场的指导者,仍将无间保合手其建壮的市场影响力和本领启程点地位。 2024 年 AI 芯片市场占有率:英伟达占据约 75%,其他定制化芯片占 10%-15%,剩余的 10%-15% 由超微、英特尔等企业等分。另据 DIGITIMES Research 数据,2024 年高端管事器 GPU 产值预估将达到 1022 亿好意思元。
从此前的居品研究来看,英伟达的 AI 芯片 Blackwell 居品发货将从 2025 财年的四季度开动,届时将同期发货 Blackwell 和 Hopper 两大系列的居品。而芯片业则已开动着眼英伟达的下一代 Rubin 芯片。大摩分析师 Charlie Chan 显现,台积电和供应链已在为 Rubin 芯片的推出作念准备,推出的时辰有可能从 2026 年上半年提前到 2025 年下半年。2025 年下半年将插足流片阶段。下一代 Rubin 芯片将接管 3nm 工艺、CPO(共同封装光学元件)和 HBM4(第六代高频宽内存)等,性能将愈加建壮。
AMD 行动英伟达的主要竞争敌手之一,在 AI 芯片市场也进展出刚劲增长势头。下一代 AMD Instinct MI350 系列加快器有望在 2025 年下半年上市。其基于 AMD CDNA 4 架构,推感性能比基于 AMD CDNA 3 的加快器提高 35 倍。
依依网英特尔在 AI 芯片市场也领有一定份额,但本年推出的 Gaudi 3 进展并不令东说念主惬意,尽管 Gaudi 3 在性能上有所晋升,可市场份额仍然较小,权衡占有率约为 1%。不外,2025 年英特尔寄托厚望的 Intel 18A 将会量产。下一代 AI PC 处置器 Panther Lake 和下一代数据中心处置器 Clearwater Forest 将基于 Intel 18A,也在来岁发布。此外,按此前的研究,2025 年英特尔还将推出一款全新的 AI 加快器居品 Falcon Shores。这是 Gaudi 系列的后续居品。2025 年,英特尔能否在 AI 芯片市场有所进展,受到业界调治。
更令东说念主调治的是几大 AI 巨头的定制芯片开发与欺诈进度。近日,亚马逊 AWS 文书推出全新的 AI 定制芯片 Trainium3,与上代 Trainium2 比较,接管 3nm 工艺,计较性能增多 2 倍,能效晋升 40%。该居品权衡于 2025 年底量产。据了解,Adobe、AI 新创公司 Poolside、数据平台管事 Databricks 以及芯片大厂高通齐接管 Trainium2 检会其 AI 模子。将来,AI 巨头的定制芯片将是英伟达 GPU 的病笃竞争敌手。
端侧 AI 需求爆发,各大厂商提前卡位
2025 年的另一个病笃趋势是,AI 模子的旯旮和推理计较需求将赶快增长。迄今罢休,大大齐 AI 芯片行为聚首会在数据中心方面,端侧手机、PC 的 AI 欺诈也大多是从云霄调用。可是,具有信得过端侧 AI 功能的开垦权衡将于 2025 年推出,旯旮 AI 将变得愈加普及。
在数据中心领域 GPU 占据 AI 加快的主导地位,但旯旮侧的情况将愈加复杂千般,企业需要通过生动地成就 CPU、GPU 和 NPU,以知足 AI 加快的庸碌需求。在英特尔日前举办的新质坐蓐力本领生态大会上,记者看到一款英特尔与新华三共同推出的 AIGC 灵犀一体机,其基于至强处置器与 Gaudi2D 加快卡,不错在私域生动布局,进行多模子的高效推理和业务场景的闭环寄托,知足旯旮侧 AI 欺诈的多模交融、生动方便等多元需求。在 AI PC 方面,英特尔展示的基于 XPU 的 AI 算力优化案例也颇具代表性,娇傲 AI PC 在游戏、西宾提示、工场制造、市集支付等方面的庸碌后劲。
高通在端侧 AI 方面的举措雷同值得调治。在骁龙峰会时期,高通推出骁龙 8 至尊版出动平台,面向末端侧生成式 AI,接管新一代 Hexagon NPU,推感性能晋升 45%,能效晋升 45%,不祥维持更复杂的端侧 AI 欺诈,交互体验愈加运动直不雅。此外,频年来高通还与腾讯混元、智谱 AI 等大模子厂商确立配合关系,鼓动端侧 AI 欺诈的部署和落地。通过配合,高通为大模子在端侧的运行提供算力维持,并优化大模子在端侧的性能进展。
Arm 则在末端领域引入计较子系统 ( CSS ) 。此前,Arm 已将计较子系统引入基础尺度、汽车领域。Arm 的末端 CSS 中囊括了最新的 Armv9.2 Cortex CPU 集群和 Immortalis 与 Mali GPU、CoreLink 互连络统 IP,以及基于 3nm 工艺坐蓐就绪的 CPU 和 GPU。在软件器具方面,KleidiAI 和 KleidiCV 库可为端侧东说念主工智能和计较机视觉使命负载提供维持,Arm Performance Studio 不错匡助开发者简化开发经由。
跟着端侧 AI 成为新一代智妙手机、PC、汽车等智能开垦发展的驱能源伪娘 人妖,有可能将造成一个跨越云霄的宽敞市场。