25年前,我在读博士期间,从事的一个研究项目就是用人工智能技术分析实时视频,理解用户的手势。
过去 15 年,人工智能(AI)经历了一场史诗级跃迁。这场技术海啸不仅刷新了科技界的认知,也在深刻重塑人类社会的各个角落。
这段历史中,有下面几个里程碑事件。
1、AlexNet 引爆深度学习革命
2012年,由“深度学习教父”杰弗里·辛顿教授和他的两个学生打造的 AlexNet 卷积神经网络,在 ImageNet 计算机视觉大赛中以压倒性优势夺冠。他们当时在多伦多大学工作和学习。
深度学习首次显示了其巨大潜力,并拉开了现代 AI 爆发的序幕。
2013年,谷歌公司以 4400 万美元的价格收购了辛顿三人组建立的小公司,开启了 AI 人才抢夺大战。
2024年,由于在人工神经网络方面的贡献,辛顿获得诺贝尔物理学奖。

2、AlphaGo的围棋世纪大战
2014年,谷歌收购英国的 AI 公司 DeepMind。
2016年,DeepMind 打造的 AlphaGo,以 4:1 的比分战胜了世界围棋冠军李世石。这次大战将 AI 概念推向大众。
下图是当时比赛现场。前排左边执棋的是 DeepMind 程序员兼业余围观高手黄士杰,右边的是李世石。裁判席坐着的男士是DeepMind员工、欧洲职业围棋冠军樊麾二段。

三年后,心灰意冷的围棋天才李世石终止了他的围棋职业生涯。
3、Transformers 论文发布
2017年,八名谷歌研究人员发表了划时代的论文《Attention Is All You Need》,正式提出 Transformer 架构。它成为了后续几乎所有自然语言处理和大语言模型的绝对基石。
4、AlphaFold 攻克生物学世纪难题
2018年,谷歌旗下的DeepMind推出AlphaFold。它以前所未有的精度成功预测了人类已知几乎所有蛋白质的三维结构,为现代药物研发和疾病研究按下了加速键。
2024年,领导这个项目的谷歌员工德米斯·哈萨比斯 (Demis Hassabis) 和约翰·江珀 (John Jumper) 获得诺贝尔化学奖。
下图是DeepMind创始人之一哈萨比斯。他的母亲是来自新加坡的华裔。

5、ChatGPT 面世
2022 年底,OpenAI 推出了 ChatGPT。其惊艳的对话、代码编写和逻辑推理能力,在短短两个月内斩获过亿月活用户,正式拉开了全球生成式 AI(Generative AI)时代的帷幕。
6、Anthropic 异军突起
2021年,由于理念上的分歧,几名 OpenAI 核心成员离开公司,成立了 Anthropic 公司。
2023年,Anthropic 推出 Claude 系列模型。其在大文本窗口处理、代码编写和学术推理上展现出顶尖实力。
7、谷歌 Gemini 迈入原生多模态时代
2024年,谷歌推出原生多模态大模型 Gemini。其具备跨文本、代码、图像、音频和视频的无缝理解与推理能力。这标志着 AI 竞争从纯文字到全模态感知的新阶段。
纵观这十五年,AI 演进的底层逻辑就是:更强大的算力、更精妙的算法以及更浩瀚的数据。而各大巨头与新星的激烈竞逐,正在把人类慢慢推向通用人工智能(AGI)的应许之地。
AI 大爆发的黄金十五年
硅谷居士 (2026-06-07 06:06:25) 评论 (0)25年前,我在读博士期间,从事的一个研究项目就是用人工智能技术分析实时视频,理解用户的手势。
过去 15 年,人工智能(AI)经历了一场史诗级跃迁。这场技术海啸不仅刷新了科技界的认知,也在深刻重塑人类社会的各个角落。
这段历史中,有下面几个里程碑事件。
1、AlexNet 引爆深度学习革命
2012年,由“深度学习教父”杰弗里·辛顿教授和他的两个学生打造的 AlexNet 卷积神经网络,在 ImageNet 计算机视觉大赛中以压倒性优势夺冠。他们当时在多伦多大学工作和学习。
深度学习首次显示了其巨大潜力,并拉开了现代 AI 爆发的序幕。
2013年,谷歌公司以 4400 万美元的价格收购了辛顿三人组建立的小公司,开启了 AI 人才抢夺大战。
2024年,由于在人工神经网络方面的贡献,辛顿获得诺贝尔物理学奖。

2、AlphaGo的围棋世纪大战
2014年,谷歌收购英国的 AI 公司 DeepMind。
2016年,DeepMind 打造的 AlphaGo,以 4:1 的比分战胜了世界围棋冠军李世石。这次大战将 AI 概念推向大众。
下图是当时比赛现场。前排左边执棋的是 DeepMind 程序员兼业余围观高手黄士杰,右边的是李世石。裁判席坐着的男士是DeepMind员工、欧洲职业围棋冠军樊麾二段。

三年后,心灰意冷的围棋天才李世石终止了他的围棋职业生涯。
3、Transformers 论文发布
2017年,八名谷歌研究人员发表了划时代的论文《Attention Is All You Need》,正式提出 Transformer 架构。它成为了后续几乎所有自然语言处理和大语言模型的绝对基石。
4、AlphaFold 攻克生物学世纪难题
2018年,谷歌旗下的DeepMind推出AlphaFold。它以前所未有的精度成功预测了人类已知几乎所有蛋白质的三维结构,为现代药物研发和疾病研究按下了加速键。
2024年,领导这个项目的谷歌员工德米斯·哈萨比斯 (Demis Hassabis) 和约翰·江珀 (John Jumper) 获得诺贝尔化学奖。
下图是DeepMind创始人之一哈萨比斯。他的母亲是来自新加坡的华裔。

5、ChatGPT 面世
2022 年底,OpenAI 推出了 ChatGPT。其惊艳的对话、代码编写和逻辑推理能力,在短短两个月内斩获过亿月活用户,正式拉开了全球生成式 AI(Generative AI)时代的帷幕。
6、Anthropic 异军突起
2021年,由于理念上的分歧,几名 OpenAI 核心成员离开公司,成立了 Anthropic 公司。
2023年,Anthropic 推出 Claude 系列模型。其在大文本窗口处理、代码编写和学术推理上展现出顶尖实力。
7、谷歌 Gemini 迈入原生多模态时代
2024年,谷歌推出原生多模态大模型 Gemini。其具备跨文本、代码、图像、音频和视频的无缝理解与推理能力。这标志着 AI 竞争从纯文字到全模态感知的新阶段。
纵观这十五年,AI 演进的底层逻辑就是:更强大的算力、更精妙的算法以及更浩瀚的数据。而各大巨头与新星的激烈竞逐,正在把人类慢慢推向通用人工智能(AGI)的应许之地。