尽管美国政府已批准向中国客户出货H200芯片的许可证,但我们尚未产生任何相关收入。我们也不确定该产品是否会被允许进入中国。”当地时间5月20日的财报电话会上,英伟达CFO科莱特·克雷斯(Colette
Kress)再度重申H200入华前景难料。
当下,国产芯片厂商日渐崛起,但国内市场对海外高端AI芯片的渴求依然强烈。尤其当今年智能体带动Token(词元)消耗量井喷,算力过载、服务宕机的问题愈发凸显。面对“算力荒”,部分模型厂商和云厂商一方面上调产品价格,另一方面则想法设法补充“Token工厂”所需的算力供给。
供需错配加剧了高端算力资源的紧张局面,也催生了新的商机,一批居间交易从业者进入到海外算力供应领域。他们在社交平台、微信群等渠道频繁发布货源信息,寻求有意采购者,再到深圳等地看货。由于货源的稀缺性,高端AI服务器的价格在过去数月内涨势迅猛。多位业内人士告诉南都记者,一台8卡的英伟达B300服务器,报价从3月份前的不到400万元,飙升至当前约700万元。
交易风险随之而来。在深圳从事服务器租赁的谢诚(化名)对此颇有感触:“自从这个行业爆火之后,鱼龙混杂,骗子太多了,主要是热门的B300这类。”骗取定金而无法交货是业内人士眼中的常见套路。一家有AI算力资源采购需求的Token服务商人士也表达了类似担忧。其公司遇到过,签订的期货合约原本约定服务器供应商两个月内交货,但结果供应商根本找不到货,“现在必须要现货,手上有货的才签。”
求卡、涨价
“算力荒”造就卖方市场
AI算力供不应求,一些大模型厂商和云厂商甚至不得不公开“求卡”。
今年2月,月之暗面官方微博账号发帖称:“是真的缺卡。已扩容几次了,还是缺。”在评论区,该账号进一步透露,虽然在测试华为昇腾的芯片,公司仍急需一款海外厂商的GPU产品。
月之暗面公开“求卡”之际,“龙虾”等智能体尚未在中国掀起全民热潮。随着智能体在春节后“出圈”,以及AI编程、视频生成应用等AI产品普及,Token消耗量急遽攀升。国家数据局的数据显示,到今年3月,我国日均Token的调用量已经超过了140万亿,相比2024年初的1000亿增长了1000多倍,相比2025年底的100万亿,三个月内又增长超40%。
Token消耗激增导致算力负载持续承压,一系列连锁反应接踵而来:DeepSeek
服务频繁中断,智谱因算力紧张启动限时退款,阿里云、腾讯云等云厂商集体上调模型、算力和存储服务价格。
这背后,是算力需求快速抬升而供给难以及时跟上的现实。半导体产能受限已成为产业瓶颈,而中国大陆市场还受到芯片出口管制的叠加影响。台积电董事长兼首席执行官魏哲家在今年1月的业绩会上坦言:“目前产能非常紧张,我们预计2028年、2029年产能才会显著提升,并希望届时能缩小供需缺口。”阿里巴巴CEO吴泳铭在5月中旬的财报会上亦表示,当前自研AI芯片的部署主要受限于产能。
一位国内头部云厂商人士告诉记者,在芯片供应短缺的情况下,厂商只能向客户承诺一周以内的报价有效期。南都记者留意到,有云厂商员工近期也曾在私域社交平台寻觅高端AI算力卡的租赁资源。
一名从事GPU服务器居间交易的人士表示,近期市场的需求量很大,是卖方市场,“只要有货,全都抢购。”另一位做居间生意的人士透露:“B300基本都买不着,到货就被扫光。”
AI基础设施创业公司新智惠想的创始人吴健向《财经》杂志形容,现在企业都是派人带着现金到各地芯片贸易商的库房里去抢货。抢到了就直接打现金,然后赶紧发走,后续再走合同。
不过,购置算力从事Token服务业务的孙铭(化名)认为,先取货打钱、后补合同的操作模式在实践中存在,但不是行业主流做法。这种交易模式必须建立在合作多次、有了信任的基础上,否则风险极高:无法确定这批货是否真的属于卖方,万一货物实际上是其他公司的,后续很可能引发法律纠纷。
高端AI算力货源紧俏,推动价格水涨船高。谢诚告诉记者,今年3月,一台H200服务器的价格还只有200多万元,如今已涨至340万元左右,而性能更先进的B300服务器则已达到700万元左右。这一报价也得到多位其他从业者的佐证。
在孙铭看来,市场能接受什么价位,取决于该产品跟竞品的对比。比如和华为昇腾、英伟达的老款服务器比,大家会衡量B300的性价比,判断到底值不值这个价。
服务器的采购价格飙升传导至租赁市场。前述不具名Token服务商人士介绍,一台8卡的B300服务器的每月租赁价格,也从不久前的14万元涨到大概18万元。租赁算力一般按季度付费,相比直接购置服务器,可以缓解企业的资金压力。
不只是国内,算力紧缺使得海外的AI算力租赁价格同样在飙涨。算力价格数据公司Ornn5月下旬提供的数据显示,自2026年2月以来,租用英伟达尖端B200型号芯片的费用已经翻了一番,接近每小时6美元。即使是旧款H100芯片的租赁成本,在过去一个月里也上涨了63%。
毁约、骗局
灰色交易市场导致“互不信任”
南都记者注意到,在不同品牌的B300服务器中,美国AI服务器制造商超微公司(Supermicro)的产品备受欢迎。综合两位业内人士的说法,超微的服务器稳定性高、故障率低,“有很大的溢价。”
该图片疑似使用了AI生成技术,请谨慎甄别
稳定、高效地产出Token,是终端客户采购算力时特别看重的因素,这也成为不少企业更倾向于购买海外厂商服务器的原因。孙铭提到,一些国产的AI服务器运行起来容易出现故障。对于大客户,国产芯片厂商可以派人驻厂解决问题,但中小客户较难获得类似支持。如果无法保证稳定产出,“买国产服务器对我们这种中小客户来说就是不划算的。”
然而,交易海外高端算力伴随诸多风险。情节较轻的是服务器涨价诱发的毁约。孙铭算了一笔账:比如期货合约签订时,一台服务器定价在500万元左右,而当前现货价格涨到700万元,单台便存在200万元价差。由于期货通常是32台起订,只要一转手,便能额外获利6000多万元。“多少上市公司都没有这个利润。”他感慨道,与巨额的转手利润相比,卖方的违约成本显得微不足道。
南都记者获取的一份4月中下旬出具的B300服务器销售合同模版显示,若卖方逾期交货超过15个工作日,买方有权单方面解除合同,卖方应以合同总价值的5%向买方支付违约金。
为防范卖方毁约转售,行业引入高额转售违约金的责任机制。前述销售合同模版约定:卖方不得将本合同订货的货物转售他人,若违反,需按合同总金额30%支付违约金,并退还全部已付款项及资金占用利息。
但要拿到逾期交货或转售的违约赔偿,也并非易事。孙铭介绍,如果卖家拒绝支付违约金,买方只能诉至法院,而卖家对于逾期发货可能援引合同中约定的“不可抗力”条款进行抗辩。即使买方胜诉,仍可能遭遇卖方为空壳公司、法定代表人为“职业背债人
”等情况,导致难以得到违约赔偿。
情节更严重的一类风险是交易诈骗。4月下旬以来,社交平台上广泛流传着一份所谓的《2026年美超微B300高端服务器现货诈骗系列案件调查报告》,当中罗列了多起声称可公开核验的具体案例及对应的查询渠道。不过,据南都记者核实,其中不少案例无法通过所列渠道查询到相关记录。因此有受访业内人士判断,所谓的诈骗报告很有可能由AI生成。
该图片疑似使用了AI生成技术,请谨慎甄别
有博主在一则“B300服务器防诈”视频里面,张冠李戴地将一起非法吸收公众存款案,指向为B300服务器诈骗案。
与此同时,还有博主在一则“B300服务器防诈”视频里,引用了一张南方都市报官方公众号发布的案情通报截图,并通过将关键信息进行马赛克处理,张冠李戴地将一起非法吸收公众存款案,指向为B300服务器诈骗案。
尽管流传的诈骗案例真伪存疑,但认为行业存在诈骗玩家的从业者并不少。谢诚是其中之一,曾险些被骗。今年3月,他与一供货方接洽,对方声称手上有B300服务器现货。然而,在谢诚尚未见到现货的情况下,对方突然提出将现货改为期货交易,并催促支付定金。由于公司并无期货采购需求,谢诚最终拒绝合作。事后,他联系了对方名片上所示的公司,才发现名片系伪造,这名卖家在冒充该公司的客户经理。
谢诚表示,正常交易流程应当是先看货,并尽量在线下完成沟通,以降低受骗风险。除非彼此熟悉、都是信用可靠的大主体,否则直接支付定金的风险很高。他认为,如果有买家被骗,可能是接到了比较急的算力使用需求,一心想着快速锁定货源,而匆忙打款付定金。
在一个缺乏正规机制的灰色交易市场,承担风险的不只是买方,卖家亦不例外。一名居间生意人士告诉记者,现在不光卖家会骗,也存在买家只沟通但不买货。有行业文章反映,有些买家并不是真的想采购设备,要么是同行套取货源渠道和底价,要么试图将货源信息转手赚差价。
据南都记者了解,实际交易中,为了证明买家具备足够的财力,一些卖家在接洽时要求对方提供验资和营业执照——验资是对企业注册资本的实收或变更情况进行审验并出具报告。
而在签订合同时,一些卖家还会要求买家提供全额货款的国内银行信用证,确保买家的信用能力。信用证是一种结算方式,银行应买方申请,向卖方出具书面承诺,保证在卖方提交符合信用证规定的单据后付款。在前述B300服务器销售合同模版中即约定,买方在签订合同后5日内,向卖方开立金额为合同含税总金额100%的国内银行信用证。
两位受访者认为,这些交易流程设计背后,折射出当前海外高端算力交易市场买卖双方互不信任的局面。
