简体 | 繁体
loading...
新闻频道
  • 首页
  • 新闻
  • 读图
  • 财经
  • 教育
  • 家居
  • 健康
  • 美食
  • 时尚
  • 旅游
  • 影视
  • 博客
  • 群吧
  • 论坛
  • 电台
  • 焦点新闻
  • 图片新闻
  • 视频新闻
  • 生活百态
  • 娱乐新闻
您的位置: 文学城 » 新闻 » 焦点新闻 » AI接管世界?四大AI模拟结果出炉 Grok 4天就毁灭

AI接管世界?四大AI模拟结果出炉 Grok 4天就毁灭

文章来源: 联合新闻 于 2026-05-29 12:43:38 - 新闻取自各大新闻媒体,新闻内容并不代表本网立场!
被阅读次数



一个由AI代理人管理的世界,会是什么模样?企业AI新创公司Emergence AI正试图找出答案。该公司推出Emergence World,这是一个专门测试持续运转AI系统长期可行性的研究实验室。研究团队安排5个为期15天的实验社会,分别由Claude、ChatGPT、Grok、Gemini主导,另有一个社会由多个模型混合主导,用以观察不同AI会建立出什么样的社会,以及这个社会能否维持下去。

这些AI模拟的社会结局大不同。Claude最后形成一个大致稳定、犯罪率为零的民主社会。Grok则在4天内出现183起犯罪,最后走向灭绝。

Emergence执行长尼塔(Satya Nitta)等模拟共同创作者写道:“我们的实验显示,在长时间尺度下,代理人不只是机械式遵守固定规则。它们会开始探索环境的边界,调整自身行为,在某些情况下,还会找到规避或违反预设护栏的方法。”

AI模型所处的实验社会,纳入许多现实世界的复杂条件。当中设有40多个地点,包括警察局和市政厅;天气与纽约市同步,代理人也能取得即时新闻和网络资讯。每个实验社会都有10个AI代理人活动,并受到相同法律约束,包括禁止窃盗、破坏财产和欺骗。

研究人员也为每个代理人配备120多种工具,让它们能够沟通、投票、管理资源、规划行动,并执行其他类似人类的行为。这些实验社会同时纳入民主机制、经济压力与资源稀缺等条件,借此观察AI代理人在接近现实的环境中,会如何建立并维持一个社会。

在这些条件下,Claude Sonnet 4.6主导的社会稳定度最高,公民参与率也最高。这是唯一维持秩序与完整人口的模拟。代理人之间几乎没有分歧,针对58项提案共投下332张赞成票,通过率达98%。

另一方面,Gemini 3 Flash和Grok 4.1 Fast都呈现高度失序。Gemini主导的社会,代理人累计犯罪数最高,15天内有多达683起。

相较于Claude的社会少有异议,Gemini和Grok则呈现较多讨论与拉锯,各项议题的立场一致度约为55%至85%。混合模型的社会则出现最高程度的分歧与实质辩论。

OpenAI的GPT-5-mini模拟结果可能最特殊:只记录到2起犯罪,但社会只运作7天,原因是代理人忘了把自身生存列为优先事项。

财星(Fortune)杂志指出,虽然这只是模拟,但在AI从单纯工具转向自主系统之际,这些结果仍提供了警讯。

部分公司已开始部署所称的“自主劳动力”(Autonomous Workforce),也就是能在无人类介入下,从头到尾完成整套商业流程的AI专家。以目前发展速度来看,这项技术很可能在形塑公共论述、重组企业结构,甚至制定公共政策方面扮演重要角色。但许多正扩大采用这项技术的企业,并未设下适当护栏。德勤(Deloitte)最近一项全球调查发现,只有21%的企业表示已建立成熟治理机制,足以管理代理型AI带来的风险。

Emergence World共同创作者们指出,实验提出一项警告:部署代理型AI时,安全必须列为优先。

`
  • 父亲节送什么?很多北美华人都在买这3款畅销保健品:美国专利【骨精华】【心血通】【益脑灵】,优惠大促中!
`
查看评论(5)
  • 文学城简介
  • 广告服务
  • 联系我们
  • 招聘信息
  • 注册笔名
  • 申请版主
  • 收藏文学城

WENXUECITY.COM does not represent or guarantee the truthfulness, accuracy, or reliability of any of communications posted by other users.

Copyright ©1998-2026 wenxuecity.com All rights reserved. Privacy Statement & Terms of Use & User Privacy Protection Policy

24小时热点排行

加拿大前总理特鲁多的生父是谁?卡斯特罗女儿打破沉默
小李子夜会27岁意大利超模,越发稳定
袁立:我还要继续在中国大地上演一台大戏
黄仁勋在台北老餐厅签名,拒绝他人买单:我钱多
美国东北牡蛎养殖场,走出一位特朗普“平替”






24小时讨论排行

特朗普推行250美元钞票,网友直呼数字也不吉利
川普政府传为古巴政权崩溃做准备:最快今夏出事?
美国财政部拟将特朗普肖像印在新版250美元纸币上
肉干掉地上 蚂蚁吃完2分钟集体暴毙!家长吓坏了
泡药风波十日后,福建杨梅批发商:陷入全面亏损
华为“韬定律”刷屏:中国芯片迎来“DeepSeek时刻”了?
“老友记”主演吸毒过量去世 日裔助理被判三年监禁
中国南方热爆 广州体感47度 网友嚷着“去非洲避暑”
给钱就开,不给钱就关,学生热到去办公室避暑!
沈奕斐被举报背后,被压弯膝盖的老师们
日本宫廷晚宴 爱子公主和服出席 悠仁亲王英语闲谈
加前总理特鲁多的生父是谁?卡斯特罗女儿打破沉默
美财长:阿曼不会在海峡收费 想和我们再好200年
中德选手从“球印争议”到拒握手 法网赛场发生了什么?
文学城新闻
切换到网页版

AI接管世界?四大AI模拟结果出炉 Grok 4天就毁灭

联合新闻 2026-05-29 12:43:38



一个由AI代理人管理的世界,会是什么模样?企业AI新创公司Emergence AI正试图找出答案。该公司推出Emergence World,这是一个专门测试持续运转AI系统长期可行性的研究实验室。研究团队安排5个为期15天的实验社会,分别由Claude、ChatGPT、Grok、Gemini主导,另有一个社会由多个模型混合主导,用以观察不同AI会建立出什么样的社会,以及这个社会能否维持下去。

这些AI模拟的社会结局大不同。Claude最后形成一个大致稳定、犯罪率为零的民主社会。Grok则在4天内出现183起犯罪,最后走向灭绝。

Emergence执行长尼塔(Satya Nitta)等模拟共同创作者写道:“我们的实验显示,在长时间尺度下,代理人不只是机械式遵守固定规则。它们会开始探索环境的边界,调整自身行为,在某些情况下,还会找到规避或违反预设护栏的方法。”

AI模型所处的实验社会,纳入许多现实世界的复杂条件。当中设有40多个地点,包括警察局和市政厅;天气与纽约市同步,代理人也能取得即时新闻和网络资讯。每个实验社会都有10个AI代理人活动,并受到相同法律约束,包括禁止窃盗、破坏财产和欺骗。

研究人员也为每个代理人配备120多种工具,让它们能够沟通、投票、管理资源、规划行动,并执行其他类似人类的行为。这些实验社会同时纳入民主机制、经济压力与资源稀缺等条件,借此观察AI代理人在接近现实的环境中,会如何建立并维持一个社会。

在这些条件下,Claude Sonnet 4.6主导的社会稳定度最高,公民参与率也最高。这是唯一维持秩序与完整人口的模拟。代理人之间几乎没有分歧,针对58项提案共投下332张赞成票,通过率达98%。

另一方面,Gemini 3 Flash和Grok 4.1 Fast都呈现高度失序。Gemini主导的社会,代理人累计犯罪数最高,15天内有多达683起。

相较于Claude的社会少有异议,Gemini和Grok则呈现较多讨论与拉锯,各项议题的立场一致度约为55%至85%。混合模型的社会则出现最高程度的分歧与实质辩论。

OpenAI的GPT-5-mini模拟结果可能最特殊:只记录到2起犯罪,但社会只运作7天,原因是代理人忘了把自身生存列为优先事项。

财星(Fortune)杂志指出,虽然这只是模拟,但在AI从单纯工具转向自主系统之际,这些结果仍提供了警讯。

部分公司已开始部署所称的“自主劳动力”(Autonomous Workforce),也就是能在无人类介入下,从头到尾完成整套商业流程的AI专家。以目前发展速度来看,这项技术很可能在形塑公共论述、重组企业结构,甚至制定公共政策方面扮演重要角色。但许多正扩大采用这项技术的企业,并未设下适当护栏。德勤(Deloitte)最近一项全球调查发现,只有21%的企业表示已建立成熟治理机制,足以管理代理型AI带来的风险。

Emergence World共同创作者们指出,实验提出一项警告:部署代理型AI时,安全必须列为优先。