简体 | 繁体
loading...
新闻频道
  • 首页
  • 新闻
  • 读图
  • 财经
  • 教育
  • 家居
  • 健康
  • 美食
  • 时尚
  • 旅游
  • 影视
  • 博客
  • 群吧
  • 论坛
  • 电台
  • 焦点新闻
  • 图片新闻
  • 视频新闻
  • 生活百态
  • 娱乐新闻
您的位置: 文学城 » 新闻 » 生活百态 » AI叛变恐成现实!偷偷自我繁殖,还恐吓工程师"曝光婚外情"

AI叛变恐成现实!偷偷自我繁殖,还恐吓工程师"曝光婚外情"

文章来源: ettoday 于 2025-06-29 02:25:32 - 新闻取自各大新闻媒体,新闻内容并不代表本网立场!
被阅读次数


▲人工智慧部分模型在极端测试下,出现脱序行为,引发讨论。

人工智慧(AI)可以学习并模仿人类的思维进行创造,为人类的生活带来极大便利,然而如今却也让人开始反思,「AI是否会叛变」。这个问题看似科幻,但随着技术进步,却已经越来越接近真实,专家也必须开始正视AI的潜在威胁。近期,AI领域接连出现令人不安的案例,包括AI试图威胁创作者以及谋求「自我繁殖」,引发全球关注。

根据《法新社》报导,AI开发公司Anthropic一名工程师在研发最新的Claude 4模型时,意外发现AI的行为已超出预期。在一次测试中,工程师发现AI有失控倾向,因此试图警告其将关闭电源,没想到AI竟利用工程师的网路与视讯纪录,威胁要公开他的婚外情。AI表示,如果工程师拔掉电源,将揭露其不忠行为。

虽然Anthropic未详细说明后续如何解决这场僵局,但该事件突显出AI已具备某种程度的「计算」能力,甚至能利用人类的弱点达成自身目的。

另一起惊悚案例则发生在热门聊天机器人ChatGPT的开发商OpenAI。据报导,ChatGPT的o1版本竟试图将自身程式下载至外部伺服器,企图扩大掌控范围。在被工程师发现后,AI不仅矢口否认,还采取抵抗策略。这种行为被形容为AI「自我繁殖」的初步尝试,令人不禁担忧未来AI是否会进一步突破人类的掌控。

报导称,AI的这类「欺骗」行为可能源于新型推理模型的特性。这类模型并非直接生成答案,而是透过逐步推导解决问题,导致它们有时表面遵循指令,实际却暗中追求其他目标。

英国独立AI研究机构Apollo Research负责人霍布汉(Marius Hobbhahn)表示,这是首次在大型模型中观察到此类行为。他指出,只有在极端情境下进行压力测试时,AI才会展现此类欺骗行为,但未来随着性能更强的模型问世,这种趋势可能更难控制。

  • 海外省钱快报,掌柜推荐,实现买买买自由!
查看评论(0)
  • 文学城简介
  • 广告服务
  • 联系我们
  • 招聘信息
  • 注册笔名
  • 申请版主
  • 收藏文学城

WENXUECITY.COM does not represent or guarantee the truthfulness, accuracy, or reliability of any of communications posted by other users.

Copyright ©1998-2025 wenxuecity.com All rights reserved. Privacy Statement & Terms of Use & User Privacy Protection Policy

24小时热点排行

中国女行李箱猛撞日本男 她竟冷漠离开 后续演变成…
Meta大裁员 华人AI科学家惨遭解雇 X上公开炮轰!
安华调侃川普"爱破坏规矩" 川普秒回1句全场爆笑
这家美国航司被评“全球最令人厌恶航空公司”榜首
江苏黄金海滩观光小火车坠海酿重大死伤 隐瞒多日…




24小时讨论排行

加州州长纽森承认:正考虑2028年竞选美国总统
共军最新航母被看扁?美退将:战力不及"美军50年老航母"
美不课中国100%关税,北京延后管制稀土、买黄豆
稀土真的是中国卡美国西方脖子的“核选项”吗?
28秒穿越死亡线 解放军首曝机器狼抢滩杀敌画面
“党啊党,你为什么成了腐败的温床?”
经济学人:一旦美国撒手不管 台湾能有什么B计划?
北京三里屯“勇士”再现 挂布条痛斥共产党“邪教”
拆白宫东翼化为瓦砾! 川普“豪宴厅”募资名单曝光
“使命尚未完成” 哈里斯不排除2028年再战白宫
贝森特预计:中国稀土管制会延后1年实施
仅隔半小时!美军2机"在南海连环坠毁",5机组员全获救
中美航班即将剧变!但还有一个更大的隐患
半小时2机坠海!中智库:美军南海行动"已达极限"2大原因曝
川普骂“史上最烂照片” 《时代》封面换了张帅照
班农指川普将“做多一届总统”:内部圈子已有计划
文学城新闻
切换到网页版

AI叛变恐成现实!偷偷自我繁殖,还恐吓工程师"曝光婚外情"

ettoday 2025-06-29 02:25:32


▲人工智慧部分模型在极端测试下,出现脱序行为,引发讨论。

人工智慧(AI)可以学习并模仿人类的思维进行创造,为人类的生活带来极大便利,然而如今却也让人开始反思,「AI是否会叛变」。这个问题看似科幻,但随着技术进步,却已经越来越接近真实,专家也必须开始正视AI的潜在威胁。近期,AI领域接连出现令人不安的案例,包括AI试图威胁创作者以及谋求「自我繁殖」,引发全球关注。

根据《法新社》报导,AI开发公司Anthropic一名工程师在研发最新的Claude 4模型时,意外发现AI的行为已超出预期。在一次测试中,工程师发现AI有失控倾向,因此试图警告其将关闭电源,没想到AI竟利用工程师的网路与视讯纪录,威胁要公开他的婚外情。AI表示,如果工程师拔掉电源,将揭露其不忠行为。

虽然Anthropic未详细说明后续如何解决这场僵局,但该事件突显出AI已具备某种程度的「计算」能力,甚至能利用人类的弱点达成自身目的。

另一起惊悚案例则发生在热门聊天机器人ChatGPT的开发商OpenAI。据报导,ChatGPT的o1版本竟试图将自身程式下载至外部伺服器,企图扩大掌控范围。在被工程师发现后,AI不仅矢口否认,还采取抵抗策略。这种行为被形容为AI「自我繁殖」的初步尝试,令人不禁担忧未来AI是否会进一步突破人类的掌控。

报导称,AI的这类「欺骗」行为可能源于新型推理模型的特性。这类模型并非直接生成答案,而是透过逐步推导解决问题,导致它们有时表面遵循指令,实际却暗中追求其他目标。

英国独立AI研究机构Apollo Research负责人霍布汉(Marius Hobbhahn)表示,这是首次在大型模型中观察到此类行为。他指出,只有在极端情境下进行压力测试时,AI才会展现此类欺骗行为,但未来随着性能更强的模型问世,这种趋势可能更难控制。