简体 | 繁体
loading...
新闻频道
  • 首页
  • 新闻
  • 读图
  • 财经
  • 教育
  • 家居
  • 健康
  • 美食
  • 时尚
  • 旅游
  • 影视
  • 博客
  • 群吧
  • 论坛
  • 电台
  • 焦点新闻
  • 图片新闻
  • 视频新闻
  • 生活百态
  • 娱乐新闻
您的位置: 文学城 » 新闻 » 生活百态 » AI叛变恐成现实!偷偷自我繁殖,还恐吓工程师"曝光婚外情"

AI叛变恐成现实!偷偷自我繁殖,还恐吓工程师"曝光婚外情"

文章来源: ettoday 于 2025-06-29 02:25:32 - 新闻取自各大新闻媒体,新闻内容并不代表本网立场!
被阅读次数


▲人工智慧部分模型在极端测试下,出现脱序行为,引发讨论。

人工智慧(AI)可以学习并模仿人类的思维进行创造,为人类的生活带来极大便利,然而如今却也让人开始反思,「AI是否会叛变」。这个问题看似科幻,但随着技术进步,却已经越来越接近真实,专家也必须开始正视AI的潜在威胁。近期,AI领域接连出现令人不安的案例,包括AI试图威胁创作者以及谋求「自我繁殖」,引发全球关注。

根据《法新社》报导,AI开发公司Anthropic一名工程师在研发最新的Claude 4模型时,意外发现AI的行为已超出预期。在一次测试中,工程师发现AI有失控倾向,因此试图警告其将关闭电源,没想到AI竟利用工程师的网路与视讯纪录,威胁要公开他的婚外情。AI表示,如果工程师拔掉电源,将揭露其不忠行为。

虽然Anthropic未详细说明后续如何解决这场僵局,但该事件突显出AI已具备某种程度的「计算」能力,甚至能利用人类的弱点达成自身目的。

另一起惊悚案例则发生在热门聊天机器人ChatGPT的开发商OpenAI。据报导,ChatGPT的o1版本竟试图将自身程式下载至外部伺服器,企图扩大掌控范围。在被工程师发现后,AI不仅矢口否认,还采取抵抗策略。这种行为被形容为AI「自我繁殖」的初步尝试,令人不禁担忧未来AI是否会进一步突破人类的掌控。

报导称,AI的这类「欺骗」行为可能源于新型推理模型的特性。这类模型并非直接生成答案,而是透过逐步推导解决问题,导致它们有时表面遵循指令,实际却暗中追求其他目标。

英国独立AI研究机构Apollo Research负责人霍布汉(Marius Hobbhahn)表示,这是首次在大型模型中观察到此类行为。他指出,只有在极端情境下进行压力测试时,AI才会展现此类欺骗行为,但未来随着性能更强的模型问世,这种趋势可能更难控制。

  • 功效卓著,回头客众多!美国专利【骨精华】消除关节痛//骨质疏松;【心血通+益脑灵】强心护脑。
查看评论(0)
  • 文学城简介
  • 广告服务
  • 联系我们
  • 招聘信息
  • 注册笔名
  • 申请版主
  • 收藏文学城

WENXUECITY.COM does not represent or guarantee the truthfulness, accuracy, or reliability of any of communications posted by other users.

Copyright ©1998-2025 wenxuecity.com All rights reserved. Privacy Statement & Terms of Use & User Privacy Protection Policy

24小时热点排行

索尼突然撤出中国!3万员工瞬间丢饭碗
“第一批免签去俄罗斯的中产,傻眼了”上热搜
央视春晚标志撞脸六四“坦克人”!网嘲:造反了
7旬亿万富豪热恋24岁女友成全美笑柄?砸巨资助她暴富…
曾买春被查!国际3大赛夺奖钢琴家试图轻生后获救




24小时讨论排行

东京演唱会上 中国人向高市早苗大骂脏话
他拍下了新疆再教育营,如今美国要将他驱逐
FT:川普不断犯错 习近平什么都没做 却赢下2025…
白宫幕僚长“毒舌”采访曝光:川普像酒鬼?万斯马斯克…
“特朗普给泽连斯基最后通牒:接受条件 否则就没机会了”
又见英雄!老夫妻赤手对抗恐怖分子遭枪决 相拥殒命
画面曝光!美军又打击3艘运毒船酿8死 累计已95亡
为何北京对房产崩盘数据讳莫如深?
英伟达急着卖,中国不急着买了
川普认了为黎智英求情 判决书近200次提到川普
黎智英被判有罪,香港还能容忍多少异见?
偷渡美国无门…中国民众“走线”方向大转弯!
13个孩子遇难快两年,调查结果仍“不予公布”
悉尼夺枪侠行动前遗言曝光 伤势严重 或失去左臂
彭定康:仍相信中共可改革的人 应谨记黎智英案
特朗普:委内瑞拉已被美国舰队完全包围
文学城新闻
切换到网页版

AI叛变恐成现实!偷偷自我繁殖,还恐吓工程师"曝光婚外情"

ettoday 2025-06-29 02:25:32


▲人工智慧部分模型在极端测试下,出现脱序行为,引发讨论。

人工智慧(AI)可以学习并模仿人类的思维进行创造,为人类的生活带来极大便利,然而如今却也让人开始反思,「AI是否会叛变」。这个问题看似科幻,但随着技术进步,却已经越来越接近真实,专家也必须开始正视AI的潜在威胁。近期,AI领域接连出现令人不安的案例,包括AI试图威胁创作者以及谋求「自我繁殖」,引发全球关注。

根据《法新社》报导,AI开发公司Anthropic一名工程师在研发最新的Claude 4模型时,意外发现AI的行为已超出预期。在一次测试中,工程师发现AI有失控倾向,因此试图警告其将关闭电源,没想到AI竟利用工程师的网路与视讯纪录,威胁要公开他的婚外情。AI表示,如果工程师拔掉电源,将揭露其不忠行为。

虽然Anthropic未详细说明后续如何解决这场僵局,但该事件突显出AI已具备某种程度的「计算」能力,甚至能利用人类的弱点达成自身目的。

另一起惊悚案例则发生在热门聊天机器人ChatGPT的开发商OpenAI。据报导,ChatGPT的o1版本竟试图将自身程式下载至外部伺服器,企图扩大掌控范围。在被工程师发现后,AI不仅矢口否认,还采取抵抗策略。这种行为被形容为AI「自我繁殖」的初步尝试,令人不禁担忧未来AI是否会进一步突破人类的掌控。

报导称,AI的这类「欺骗」行为可能源于新型推理模型的特性。这类模型并非直接生成答案,而是透过逐步推导解决问题,导致它们有时表面遵循指令,实际却暗中追求其他目标。

英国独立AI研究机构Apollo Research负责人霍布汉(Marius Hobbhahn)表示,这是首次在大型模型中观察到此类行为。他指出,只有在极端情境下进行压力测试时,AI才会展现此类欺骗行为,但未来随着性能更强的模型问世,这种趋势可能更难控制。