物理学如何使现代人工智能成为可能

每周《全态》杂志解释了推动现代研究的最重要的思想之一。本周,计算机科学特约撰稿人本·布鲁贝克文章解释了物理学中的理念如何塑造了人工智能的发展,以及这些理念如今如何仍在激发进步。

物理学如何使现代人工智能成为可能
作者:本·布鲁贝克

物理学家以大胆的想法闯入其他科学领域而闻名,但这些想法并不总是奏效。(这是一位正在康复的物理学家的话。)但有时他们的见解确实被证明是革命性的——也许最能体现在人工智能的研究上。

乍看之下,物理学和人工智能似乎不太搭调。物理学家通常研究与“智力”无关的自然现象,无论如何定义。在人工智能的早期研究中,大部分工作都集中在“符号”方法上,即研究人员致力于构建能够以新颖方式结合预定义概念的人工智能系统。这个符号化的方法利用了心理学和数理逻辑的研究,几乎看不到一个物理学家。

随后在1980年代,一些特立独行的研究人员重新提出了基于数学结构——即所谓的神经网络——的另一种人工智能方法。神经网络由仿照人脑结构设计的人工“神经元”组成,结构较为松散。神经网络研究人员不是从预定义的概念开始,而是想了解他们的系统如何通过在邻近神经元之间形成连接,从头开始“学习”概念。

这就是物理学的作用。物理学中有一个成熟的分支,叫统计力学,研究许多简单系统之间的相互作用产生的集体行为,比如磁性材料中的原子。网络中的神经元也是具有复杂集体行为的简单系统。1982年,受这个类比的启发,物理学家约翰·霍普菲尔德基于一个非同寻常的磁性材料的数学模型创建了一种神经网络。霍普菲尔德的网络可以学习存储神经元活动的模式,并在以后再现它们,赋予它一种简单的记忆。这是一个新颖而优雅的解决方案,旨在解决困扰许多AI研究人员的难题。

几年后,计算机科学家杰弗里·辛顿等人基于霍普菲尔德的研究成果,设计出了至今仍被用于训练人工智能系统的方法。在2024年,这对搭档被授予了诺贝尔物理学奖,这充分证明了该领域对人工智能研究产生了多么深远的影响。伊莉斯·卡茨探索他们工作的影响力4月作为一部分量子‘系列文章人工智能时代的科学.

新事物和值得注意的事项

自霍普菲尔德和欣顿的开创性工作以来,人工智能研究人员已经找到许多新方法,以重新利用来自物理学的理念。计算机科学家伦卡·兹德博罗娃通过相变这一视角来分析人工智能模型——相变是物理系统在特定温度下发生的显著行为变化,例如水在沸点时从液态转变为气态。约翰·帕夫柳斯专访德博罗去年十月,她在ChatGPT等语言模型中的相变方面的工作。

其他物理现象已经影响到了旨在生成图像的AI系统。最广泛使用的AI图像生成器,即所谓的扩散模型,是基于描述一滴牛奶如何在咖啡杯中扩散的方程式构建的。2023年1月,阿尼尔·安纳塔斯瓦米探索扩散模型是如何工作的并叙述了导致其广泛采用的一系列突破。那年9月,史蒂夫·纳迪斯写了一篇关于新方法基于描述电荷流动的方程式进行AI图像生成。正如韦伯·赖特上个月报道的那样,研究人员最近认为,扩散模型所显示的明显创造性可以用它们受物理启发的建筑来解释。

AI研究人员还从与日常生活相去甚远的更抽象的物理领域中汲取灵感。2020年1月,帕夫柳斯写下了一种新型图像识别网络基于基本粒子的数学对称性。“我一直有种感觉,机器学习与物理学在做的事情非常相似,”人工智能研究员塔科·科恩告诉帕夫卢斯,“随着我们不断改进系统,我们逐渐揭示出了越来越多的关联。”

发表评论

邮箱地址不会被公开。