
他山石智库多年积累诸多顶级专家资源,精选推荐国内外人工智能领域重量级专家,2025已开放合作邀约。如有大会发言、企业内训、代言背书等需求,请联系他山石智库。
【如需邀请诺奖得主、图灵奖得主、国内院士或其他领域专家 请联系他山石智库】
2025 年 6 月 6 日,第七届北京智源大会在北京正式开幕,强化学习奠基人、2025年图灵奖得主、加拿大计算机科学家Richard S. Sutton以“欢迎来到经验时代”为题发表主旨演讲,称我们正处在人工智能史上从“人类数据时代”迈向“经验时代”的关键拐点。
Sutton指出,当今所有大型语言模型依赖互联网文本和人工标注等“二手经验”训练,但高质量人类数据已被快速消耗殆尽,新增语料的边际价值正急剧下降;近期多家研究也观察到模型规模继续膨胀却收效递减的“规模壁垒”现象,以及大量科技公司开始转向合成数据。
在Sutton看来,要突破这一极限,智能体必须像婴儿学习玩具、足球运动员在赛场决策那样,通过与环境交互不断生成并利用第一手经验,而非单纯模仿人类旧有文本。这一观点呼应了Alan Turing1947年就已提出的预言——“我们想要的是一台能够从经验中学习的机器”——为人工智能奠定了早期哲学基础。Sutton与长期合作者Andrew Barto凭借强化学习框架将这一理念工程化,并因此荣膺2024/25年度图灵奖,强化学习也在AlphaGo、机器人控制等里程碑项目中反复验证其可行性。
他进一步阐释“经验时代”的技术特征:智能体需要在真实或高保真模拟环境中持续运行,用环境回馈而非人类偏好作为原生奖励信号,发展能够长期复用的世界模型与记忆体系,并通过高并行交互大幅提升样本效率。
超越技术维度,Sutton把视角拓展到社会治理,强调“去中心化合作”优于“中心化控制”。他警示,要求用单一目标束缚 AI 的论调与历史上出于恐惧而试图控制人类行为的思路惊人相似;真正的进步源于多元目标并存的生态系统,通过分布式激励与竞争协作保持创新活力。
在他看来,让智能体和人类都保持多样化追求,不仅能降低单点失效与僵化风险,也为未来AI治理提供了更具韧性的框架。
划重点:
当前大型模型已逼近“人类数据”边界,唯有让智能体通过与环境实时交互来生成可随能力指数级扩张的原生数据,AI 才能迈入“经验时代” 。
真正的智能应像婴儿或运动员那样在感知-行动循环中凭第一人称经验自我学习 。
强化学习范例(如 AlphaGo、AlphaZero)已证明从模拟经验到现实经验的演进路径,未来智能体将依靠自生奖励和世界模型实现持续自我提升 。
基于恐惧的“中心化控制”会扼杀创新,多主体维持差异化目标并通过去中心化合作实现双赢,这是人类与 AI 共同繁荣的制度根基 。
面向超越人类的智能体与人机共生的远景,我们应保持理性乐观——这是一场需要几十年耐心长跑的工程,其成败取决于更强的持续学习算法与开放共享的生态。
大会发言/企业内训/代言背书
他山石智库 2015 年来商业合作数百位诺贝尔奖得主、图灵奖得主、两院院士、藤校牛剑院长教授、世界500强领导者、联合国高层及 openai 创始人等人工智能科学家、经济学家、企业家及《未来简史》作者赫拉利;世界首富马斯克母亲梅耶·马斯克等。为北京、上海、杭州、广州、深圳政府举办的国际化论坛、峰会提供演讲嘉宾;为阿里、腾讯、字节、百度等公司大会提供演讲嘉宾,并运营诺贝尔奖专家领衔的品牌代言背书和海外传播。他山石智库还应用独一无二资源,送数百位中国学子去美国常青藤及前三十大学,英国牛津,剑桥等名校留学。创始团队来自国务院发展研究中心、财新、清华、麻省理工。