简体 | 繁体
loading...
新闻频道
  • 首页
  • 新闻
  • 读图
  • 财经
  • 教育
  • 家居
  • 健康
  • 美食
  • 时尚
  • 旅游
  • 影视
  • 博客
  • 群吧
  • 论坛
  • 电台
  • 焦点新闻
  • 图片新闻
  • 视频新闻
  • 生活百态
  • 娱乐新闻
您的位置: 文学城 » 新闻 » 焦点新闻 » 网友:中国大模型何时达到Fable级别?马斯克回复了

网友:中国大模型何时达到Fable级别?马斯克回复了

文章来源: 华尔街见闻 于 2026-06-18 22:35:45 - 新闻取自各大新闻媒体,新闻内容并不代表本网立场!
被阅读次数

围绕Anthropic前沿模型遭出口管制下架,一场关于中国大模型追赶时间表的公开辩论正在X平台上演,多方观点的交锋折射出AI行业格局加速重塑的现实。

在智谱AI发布GLM-5.2后,6月18日,一名X用户向独立研究员、AI 开发博主Teortaxes提问"中国大模型何时达到Fable级别"。

Teortaxes给出了7个月的时间差判断,马斯克随即回复"可能(2027年)第一季度",智谱AI CEO唐杰则直接表态"不需要那么久"。

网友:中国大模型何时达到Fable级别?马斯克回复了

马斯克随后补充,在基准测试上追赶相对容易,但以"真实实用性"衡量,明年Q1也已经相当出色。



这场对话的背景是GLM-5.2在关键编程基准FrontierSWE上取得74.4分,仅落后Anthropic顶级闭源模型Opus 4.8约1个百分点,并超过GPT-5.5。



华尔街见闻此前提及,美国商务部对Anthropic旗下Fable 5和Mythos5实施出口管制,要求向任何外国人提供访问权限前须取得政府许可证,Anthropic随即关闭两款模型的全球访问权限。

技术追赶与AI成本两股力量同步作用,正在重塑全球AI竞争格局。正如zerohedge所指出的,当"10%的智能差距"可能对应"90%的成本优势"时,逾5万亿美元的资本配置是否存在错配,将成为市场持续追问的核心命题。



时间表之争:从7个月到"不需要那么久"

争论的起点来自Teortaxes对GLM-5.2性能位置的判断。

他认为,GLM-5.2整体能力处于Opus 4.7至4.8区间,他表示Opus的视觉能力本身较弱,综合考虑视觉能力后中国大模型差距大致为7个月。

他的推算逻辑是,Mythos模型于2026年2月初达到Preview状态(即≥Opus 4.8的功能水平),以此类推,中国模型达到完整"Fable"级别的时间窗口约在2026年11月至12月。

马斯克的判断则更为保守,仅以"Probably Q1"回应,对应2027年一季度。

但他随后补充了一个重要分层:在基准测试层面,追赶进展或许确实令人印象深刻;而以"真实实用性"衡量,即便到Q1也已相当不易。

他点名Anthropic的优势正在于专注于提升真实智能,这种能力不显现在基准分数上,但直接反映在营收上。

对于马斯克的言论,有AI业内人士认为,马斯克的预测相对保守,中美模型水平的时间差可能短于7个月。

谷歌DeepMind首席执行官德米斯·哈萨比斯此前也表示,中国的人工智能模型在能力上可能“只差几个月”就能赶上海外。

唐杰的回复则更为简短直接:"won't take that long"——不需要那么久。这一表态隐含了智谱对自身迭代速度的信心,但并未给出具体时间节点。

AI研究机构Proximal评价称,GLM-5.2是"第一个真正缩小了Anthropic/OpenAI与其他模型提供商之间巨大技术鸿沟的模型"。

GLM-5.2的技术坐标:逼近闭源前沿,差距仍存

围绕这场时间表讨论,GLM-5.2的技术指标是核心依据。

6月15日,智谱宣布正式上线并开源新一代旗舰大模型GLM-5.2。在全球百万用户参与盲测的前端开发评估系统Code Arena上,该模型位列全球可用模型第一位。

与以往主打即时问答能力的模型不同,GLM-5.2主攻“长程任务”——让AI不再只做即时问答,而能像人一样连续工作数小时、自主跑完一个完整的大型工程。

根据发布数据,GLM-5.2参数规模为753B,配备1M token稳定上下文窗口,采用MIT协议完全开源。



在长程编程基准FrontierSWE上,GLM-5.2得分74.4,Opus 4.8为75.1,差距约1个百分点,同时超过GPT-5.5的72.6以及Opus 4.7。



在PostTrainBench(测试Agent训练小模型能力)上,GLM-5.2以34.3分排名第二,仅次于Opus 4.8的37.2,高于GPT-5.5的28.4。

差距仍然存在。在最高难度的SWE-Marathon基准上,GLM-5.2得分13.0,而Opus 4.8为26.0,落差明显。

三个基准加在一起,传递的信息是:在中等复杂度的长程任务上,GLM-5.2 已经进入了与顶级闭源模型同台竞争的区间;在最极端复杂度的任务上,它仍然落后,但在开源阵营里独占鳌头。

Anthropic模型下架,开源替代逻辑加速成立

驱动这场讨论的另一重要背景,是Anthropic旗下Fable 5和Mythos 5的突然下线。

华尔街见闻提及,Anthropic事件暴露出闭源商业模型在可获得性上的脆弱性,并为开源阵营带来了超越技术层面的战略价值。

在GLM-5.2发布的同时,智谱AI CEO唐杰在X平台发表声明:

在前沿模型被无故切断访问的时刻,我们更加确信一件事:科学应当是全球的。通往AGI的道路绝不能由高墙围困。

这一时机选择将开源从技术路线提升至技术主权的叙事层面。该条推文在24小时内获得超过88万次浏览和252条回复。

东方证券认为,开源模型具备开放权重、自主可控、可本地部署等特征,使其成为规避地缘政治风险、保障业务连续性的更优选择。

由于国内模型性能领先、多数开源、API调用成本较低,中国模型已在OpenRouter等Token分发平台上占据领先位置。叠加Anthropic两款模型下架,国产模型API调用量有望进一步提升。

但从中长期逻辑看,成本下降与访问门槛降低,可能推动词元消耗量和算力需求同步扩张。对投资者而言,开源模型份额提升与算力需求高增,正在成为AI产业链重估的核心变量。

`
  • 父亲节送什么?很多北美华人都在买这3款畅销保健品:美国专利【骨精华】【心血通】【益脑灵】,优惠大促中!
`
查看评论(1)
  • 文学城简介
  • 广告服务
  • 联系我们
  • 招聘信息
  • 注册笔名
  • 申请版主
  • 收藏文学城

WENXUECITY.COM does not represent or guarantee the truthfulness, accuracy, or reliability of any of communications posted by other users.

Copyright ©1998-2026 wenxuecity.com All rights reserved. Privacy Statement & Terms of Use & User Privacy Protection Policy

24小时热点排行

意大利总理10岁女儿下飞机后害羞躲闪,意外走红
他飞起来了!睡地板的马斯克,“买下了白宫”
乘客猝死!纽约地铁爆"移民性侵尸体"偷东西判关5年
美国临床肿瘤学会年会发布新药:“癌王”,有救了?
梅洛尼与众人热情贴面 炫耀戒烟成功 高市遭冷落






24小时讨论排行

0数据!对手忘记了C罗,葡萄牙也得忘了情怀
BBC宣布裁员550人,试图满足5亿英镑节流计划
60天谈判倒数!美伊停火后"4大挑战"恐让冲突再起
特朗普被曝白宫私人生活,跟梅拉尼娅分房睡
G7领导人私聊内容曝光,特朗普念念不忘格陵兰岛
日本制造业曾经辉煌的历史,一切都快结束了?
美国领事官员探视被中国拘押的美籍学者敏辛
纽约时報:玉米有多健康?
美国四位前第一夫人罕见同框,为奥巴马捧场
“明星都在这儿存细胞,十几万元一次”
刚毕业的年轻人,在大城市拼好床
Fed出现转鹰讯号,市场预期年底前恐1至2次升息
文学城新闻
切换到网页版

网友:中国大模型何时达到Fable级别?马斯克回复了

华尔街见闻 2026-06-18 22:35:45

围绕Anthropic前沿模型遭出口管制下架,一场关于中国大模型追赶时间表的公开辩论正在X平台上演,多方观点的交锋折射出AI行业格局加速重塑的现实。

在智谱AI发布GLM-5.2后,6月18日,一名X用户向独立研究员、AI 开发博主Teortaxes提问"中国大模型何时达到Fable级别"。

Teortaxes给出了7个月的时间差判断,马斯克随即回复"可能(2027年)第一季度",智谱AI CEO唐杰则直接表态"不需要那么久"。

网友:中国大模型何时达到Fable级别?马斯克回复了

马斯克随后补充,在基准测试上追赶相对容易,但以"真实实用性"衡量,明年Q1也已经相当出色。



这场对话的背景是GLM-5.2在关键编程基准FrontierSWE上取得74.4分,仅落后Anthropic顶级闭源模型Opus 4.8约1个百分点,并超过GPT-5.5。



华尔街见闻此前提及,美国商务部对Anthropic旗下Fable 5和Mythos5实施出口管制,要求向任何外国人提供访问权限前须取得政府许可证,Anthropic随即关闭两款模型的全球访问权限。

技术追赶与AI成本两股力量同步作用,正在重塑全球AI竞争格局。正如zerohedge所指出的,当"10%的智能差距"可能对应"90%的成本优势"时,逾5万亿美元的资本配置是否存在错配,将成为市场持续追问的核心命题。



时间表之争:从7个月到"不需要那么久"

争论的起点来自Teortaxes对GLM-5.2性能位置的判断。

他认为,GLM-5.2整体能力处于Opus 4.7至4.8区间,他表示Opus的视觉能力本身较弱,综合考虑视觉能力后中国大模型差距大致为7个月。

他的推算逻辑是,Mythos模型于2026年2月初达到Preview状态(即≥Opus 4.8的功能水平),以此类推,中国模型达到完整"Fable"级别的时间窗口约在2026年11月至12月。

马斯克的判断则更为保守,仅以"Probably Q1"回应,对应2027年一季度。

但他随后补充了一个重要分层:在基准测试层面,追赶进展或许确实令人印象深刻;而以"真实实用性"衡量,即便到Q1也已相当不易。

他点名Anthropic的优势正在于专注于提升真实智能,这种能力不显现在基准分数上,但直接反映在营收上。

对于马斯克的言论,有AI业内人士认为,马斯克的预测相对保守,中美模型水平的时间差可能短于7个月。

谷歌DeepMind首席执行官德米斯·哈萨比斯此前也表示,中国的人工智能模型在能力上可能“只差几个月”就能赶上海外。

唐杰的回复则更为简短直接:"won't take that long"——不需要那么久。这一表态隐含了智谱对自身迭代速度的信心,但并未给出具体时间节点。

AI研究机构Proximal评价称,GLM-5.2是"第一个真正缩小了Anthropic/OpenAI与其他模型提供商之间巨大技术鸿沟的模型"。

GLM-5.2的技术坐标:逼近闭源前沿,差距仍存

围绕这场时间表讨论,GLM-5.2的技术指标是核心依据。

6月15日,智谱宣布正式上线并开源新一代旗舰大模型GLM-5.2。在全球百万用户参与盲测的前端开发评估系统Code Arena上,该模型位列全球可用模型第一位。

与以往主打即时问答能力的模型不同,GLM-5.2主攻“长程任务”——让AI不再只做即时问答,而能像人一样连续工作数小时、自主跑完一个完整的大型工程。

根据发布数据,GLM-5.2参数规模为753B,配备1M token稳定上下文窗口,采用MIT协议完全开源。



在长程编程基准FrontierSWE上,GLM-5.2得分74.4,Opus 4.8为75.1,差距约1个百分点,同时超过GPT-5.5的72.6以及Opus 4.7。



在PostTrainBench(测试Agent训练小模型能力)上,GLM-5.2以34.3分排名第二,仅次于Opus 4.8的37.2,高于GPT-5.5的28.4。

差距仍然存在。在最高难度的SWE-Marathon基准上,GLM-5.2得分13.0,而Opus 4.8为26.0,落差明显。

三个基准加在一起,传递的信息是:在中等复杂度的长程任务上,GLM-5.2 已经进入了与顶级闭源模型同台竞争的区间;在最极端复杂度的任务上,它仍然落后,但在开源阵营里独占鳌头。

Anthropic模型下架,开源替代逻辑加速成立

驱动这场讨论的另一重要背景,是Anthropic旗下Fable 5和Mythos 5的突然下线。

华尔街见闻提及,Anthropic事件暴露出闭源商业模型在可获得性上的脆弱性,并为开源阵营带来了超越技术层面的战略价值。

在GLM-5.2发布的同时,智谱AI CEO唐杰在X平台发表声明:

在前沿模型被无故切断访问的时刻,我们更加确信一件事:科学应当是全球的。通往AGI的道路绝不能由高墙围困。

这一时机选择将开源从技术路线提升至技术主权的叙事层面。该条推文在24小时内获得超过88万次浏览和252条回复。

东方证券认为,开源模型具备开放权重、自主可控、可本地部署等特征,使其成为规避地缘政治风险、保障业务连续性的更优选择。

由于国内模型性能领先、多数开源、API调用成本较低,中国模型已在OpenRouter等Token分发平台上占据领先位置。叠加Anthropic两款模型下架,国产模型API调用量有望进一步提升。

但从中长期逻辑看,成本下降与访问门槛降低,可能推动词元消耗量和算力需求同步扩张。对投资者而言,开源模型份额提升与算力需求高增,正在成为AI产业链重估的核心变量。