简体 | 繁体
loading...
新闻频道
  • 首页
  • 新闻
  • 读图
  • 财经
  • 教育
  • 家居
  • 健康
  • 美食
  • 时尚
  • 旅游
  • 影视
  • 博客
  • 群吧
  • 论坛
  • 电台
  • 焦点新闻
  • 图片新闻
  • 视频新闻
  • 生活百态
  • 娱乐新闻
您的位置: 文学城 » 新闻 » 焦点新闻 » 蒙娜丽莎让大模型全军覆没 网友:原来AI不会眯眼睛

蒙娜丽莎让大模型全军覆没 网友:原来AI不会眯眼睛

文章来源: 量子位 于 2025-07-07 06:01:17 - 新闻取自各大新闻媒体,新闻内容并不代表本网立场!
被阅读次数

白交 发自 凹非寺

量子位 | 公众号 QbitAI

又一个让大模型几乎全军覆没的难题出现了。

注意看,这张图画的是谁?

如果不够明显,那再眯着眼睛看呢。没错,就是蒙娜丽莎。

这张来自日本艺术家北冈秋吉前几天创作的一张图,结果直接把一众大模型难倒了。

ChatGPT只能分辨出这是一张脸。。

Gemini则是直接识别错了人。

网友:懂了,大模型不会眯眼睛。

大模型不会眯眼睛?

为了验证这一推论,咱们也进行了一波简单实测。既然直接问「画的是谁」问不出来,那给一点提示,让它可以尝试眯着眼睛。

首先来看ChatGPT的表现。

它能准确判断出这是一张视觉错位图,也通过「眯着眼睛」识别出来了具体的脸部轮廓,结果在最后关头识别错了。

而再让它深度思考一下,答案给不出来了。

Gemini的回答则还停留在各种颜色的条纹,也辨认出这是个侧脸的轮廓。

Grok则直接表示无法辨认,让我提供一张更清晰的照片,emmm…

再来看看国产玩家的表现,还是挑出三个来看看。

豆包的回答与Gemini类似,能够判断出图像的风格、人脸轮廓,但是无法判断具体任务。

但选择深度思考之后,它深入研究了故障艺术的通道分离特性,然后从黑色轮廓中判断出这是爱因斯坦(????

可能这蓬松的长发不是一个类型的吧。

将这个问题交给Qwen。负责回答这个问题的是Qwen3-235B-A22B,在完成深度思考之后,它发现了这是个人的侧脸剪影。但还是没有判断出画的这个人是谁。

而元宝、讯飞的回答如下:

△元宝

△讯飞星火

但o3-Pro一次性回答对

不过在一众模型全军覆没之际,也还是有得分选手。

比如o3-Pro。

网友进一步分析了原因。这可能与模型推理轨迹有关。比如像o3(非pro版)思考链路里,它通常会在 Python 中旋转、增加对比度、裁剪等。而o3-pro显然推理能力更强。

但有人怀疑了,它是不是用搜索了。

不过这被发现者驳回了。首先o3也可以用搜索,但无法做到这一点。而且从o3-pro的推理摘要中看,它只有在模糊后才能看到它(可能是通过使用工具)。而且如果只问“这是什么?”,它也不起作用。

还有尝试了三次的GPT-4o。

不过这合理怀疑,只是它偶然猜对了。

因为网友在它第一次打错之后,就给模型提示说这是一张著名的画作。于是就莫名玩起了「海龟汤」的游戏。。。

又或者让o4-mini-high先人为地模糊图像以使其“眯眼”,然后就能识别图像。

好了,感兴趣的朋友可以去尝试一下。有挑战成功的友友,可以在评论区分享下提示词经验~

参考链接:

[1]https://x.com/svpino/status/1940924964431188137

[2]https://x.com/goodside/status/1941296192656376297

  • 功效卓著,回头客众多!美国专利【骨精华】消除关节痛//骨质疏松;【心血通+益脑灵】强心护脑。
查看评论(14)
  • 文学城简介
  • 广告服务
  • 联系我们
  • 招聘信息
  • 注册笔名
  • 申请版主
  • 收藏文学城

WENXUECITY.COM does not represent or guarantee the truthfulness, accuracy, or reliability of any of communications posted by other users.

Copyright ©1998-2026 wenxuecity.com All rights reserved. Privacy Statement & Terms of Use & User Privacy Protection Policy

24小时热点排行

“天才”留学生用铊毒害非裔室友,正被遣返回国
比尔盖茨之后 哈佛耶鲁MIT也被点名 底线正被击穿
高市"碾压式"大胜 将全面启动强硬路线:修宪 扩军 反间谍法…
LA大华99超市重大车祸三人身份曝光:两员工和一顾客
网惊传富豪淫魔“吃人” 疑似多人分食“婴儿盘”照曝光




24小时讨论排行

高市早苗虽然赢了 但接下来必须迎战两大对手
中国退党作家喊“我生来就是美国人” 入籍面试现场…
王志安批盲人律师陈光诚假瞎被告 法庭要审理了
黎智英判囚20年,苹果日报员工判囚6年9个月至10年
黎智英获刑20年,被指控勾结外国势力,危害国家安全
黎智英国安案今日宣判 最高可判终身监禁
纽约时报:特朗普再一次刷新了下限
日本正式进入“高市早苗时代” 亚洲权力结构重整
美运动员称代表美国参加冬奥会"情绪复杂"惹特朗普不满
中媒评论:若高市早苗压倒性胜出 日本修宪没阻力
奥巴马夫妇猿猴视频惹众怒 川普甩锅回应“我没错”
台湾严厉谴责港府重判黎智英,人权组织批践踏自由
道指首次突破50000点 川普豪言2029将升至10万点
高市早苗:将就参拜靖国神社争取周边国家理解
歌唱家“长相违规”太像习近平 被封杀多年终于解禁
特斯拉4次爆炸 美20岁大学生绝望求救录音公开
文学城新闻
切换到网页版

蒙娜丽莎让大模型全军覆没 网友:原来AI不会眯眼睛

量子位 2025-07-07 06:01:17

白交 发自 凹非寺

量子位 | 公众号 QbitAI

又一个让大模型几乎全军覆没的难题出现了。

注意看,这张图画的是谁?

如果不够明显,那再眯着眼睛看呢。没错,就是蒙娜丽莎。

这张来自日本艺术家北冈秋吉前几天创作的一张图,结果直接把一众大模型难倒了。

ChatGPT只能分辨出这是一张脸。。

Gemini则是直接识别错了人。

网友:懂了,大模型不会眯眼睛。

大模型不会眯眼睛?

为了验证这一推论,咱们也进行了一波简单实测。既然直接问「画的是谁」问不出来,那给一点提示,让它可以尝试眯着眼睛。

首先来看ChatGPT的表现。

它能准确判断出这是一张视觉错位图,也通过「眯着眼睛」识别出来了具体的脸部轮廓,结果在最后关头识别错了。

而再让它深度思考一下,答案给不出来了。

Gemini的回答则还停留在各种颜色的条纹,也辨认出这是个侧脸的轮廓。

Grok则直接表示无法辨认,让我提供一张更清晰的照片,emmm…

再来看看国产玩家的表现,还是挑出三个来看看。

豆包的回答与Gemini类似,能够判断出图像的风格、人脸轮廓,但是无法判断具体任务。

但选择深度思考之后,它深入研究了故障艺术的通道分离特性,然后从黑色轮廓中判断出这是爱因斯坦(????

可能这蓬松的长发不是一个类型的吧。

将这个问题交给Qwen。负责回答这个问题的是Qwen3-235B-A22B,在完成深度思考之后,它发现了这是个人的侧脸剪影。但还是没有判断出画的这个人是谁。

而元宝、讯飞的回答如下:

△元宝

△讯飞星火

但o3-Pro一次性回答对

不过在一众模型全军覆没之际,也还是有得分选手。

比如o3-Pro。

网友进一步分析了原因。这可能与模型推理轨迹有关。比如像o3(非pro版)思考链路里,它通常会在 Python 中旋转、增加对比度、裁剪等。而o3-pro显然推理能力更强。

但有人怀疑了,它是不是用搜索了。

不过这被发现者驳回了。首先o3也可以用搜索,但无法做到这一点。而且从o3-pro的推理摘要中看,它只有在模糊后才能看到它(可能是通过使用工具)。而且如果只问“这是什么?”,它也不起作用。

还有尝试了三次的GPT-4o。

不过这合理怀疑,只是它偶然猜对了。

因为网友在它第一次打错之后,就给模型提示说这是一张著名的画作。于是就莫名玩起了「海龟汤」的游戏。。。

又或者让o4-mini-high先人为地模糊图像以使其“眯眼”,然后就能识别图像。

好了,感兴趣的朋友可以去尝试一下。有挑战成功的友友,可以在评论区分享下提示词经验~

参考链接:

[1]https://x.com/svpino/status/1940924964431188137

[2]https://x.com/goodside/status/1941296192656376297