• 工作总结
  • 工作计划
  • 心得体会
  • 领导讲话
  • 发言稿
  • 演讲稿
  • 述职报告
  • 入党申请
  • 党建材料
  • 党课下载
  • 脱贫攻坚
  • 对照材料
  • 主题教育
  • 事迹材料
  • 谈话记录
  • 扫黑除恶
  • 实施方案
  • 自查整改
  • 调查报告
  • 公文范文
  • 思想汇报
  • 当前位置: 雅意学习网 > 文档大全 > 公文范文 > 正文

    预测加工与康德心智理论——围绕当前争论的辨析*

    时间:2023-06-15 22:30:02 来源:雅意学习网 本文已影响 雅意学习网手机站

    李恒威 康文煌

    提要:预测加工被认为是一种能统一解释所有心智现象的基本机制。预测加工理论认为,脑基于模型进行预测,知觉是脑内模型的自发性预测信号与外界作用于感官的刺激信号相互作用建构的结果。霍威、克拉克、斯旺森等人认为,预测加工与康德的心智理论有很深的渊源,并且康德的心智理论以赫姆霍茨为中介预示了预测加工。但奥兰迪、本尼、扎哈维等人对这种观点有异议。例如,他们认为,预测加工的具身性和生态心理学的解读与康德鲜有关联。通过考察当前关于预测加工与康德的心智理论之关系的讨论和争论,我们尝试论述预测加工与康德关于心智工作原理上的关联和差别。尽管预测加工与康德思想存在跨越历史的呼应,但这还不足以表明预测加工是康德思想的直接历史后承,更不能得出“预测加工根源于康德”这种过强的主张。

    近年来,预测加工(Predictive processing,PP)在哲学和认知科学领域受到广泛和强烈的关注,呈现出强劲的发展势头。预测加工被认为是认知科学理论领域中的下一个大事件,是一种可以统一解释所有心智现象(诸如知觉、记忆、注意、想象、情绪、意图、行动),尤其是知觉与行动之关系的机制,“它为心智和行动的统一科学的形成提供了迄今为止最好的线索”(1)A. Clark,“Whatever Next? Predictive Brains, Situated Agents, and the Future of Cognitive Science,”Behavioral And Brain Sciences,Vol. 36,No. 3,2013,pp.181-253.。预测加工有悠久的前史,目前它有许多变体名称,诸如预测编码(predictive coding)、主动推断(active inference)、贝叶斯脑(Bayesian brain)、自由能原理(free energy principle)等。

    预测加工理论认为脑是一种“预测机器”或“假说检验机器”。脑基于有机体对其生活世界的过往经验(或者说,对其生活世界的“先验”信念或“先验”模型),不断地对环境状况进行主动、自发的预测,并针对来自环境的感官信号流与预测的匹配程度来检验这些预测,从而形成知觉,以此指导行动和推动学习。通常,脑通过某种近似贝叶斯推断(Bayesian inference)的机制来实现预测检验。

    根据传统的标准知觉理论,知觉是感官信息不断前馈的结果。脑“从感官中获得能量输入,通过一个逐步建构的、累积式的复杂结构,以类似于拼装乐高积木的方式将其转化为连贯的知觉经验”(2)安迪·克拉克:《预测算法:具身智能如何应对不确定性》,刘林澍译,机械工业出版社,2020年,第58页。。这种传统知觉理论将脑看成是一个被动的、受外源刺激驱动的装置,而知觉是感官信息自下而上不断前馈的线性转变的结果。

    与这种以客体为中心的、外源的、被动的、单向的、线性的知觉理论不同,预测加工理论确实蕴含了某种意义上的革命性转变,因为“它揭示知觉是一个主动的、建构的过程,而不是对外部客观现实的被动登记”(3)D. Mendonca, M. Curado and S. Gouveia,eds.,The Philosophy and Science of Predictive Processing, Bloomsbury Publishing,2020,pp.xvi, xiv.。概括地说,预测加工所论的知觉既不是纯粹的客观主义,也不是纯粹的主观主义,而是一种兼取两者的、调和的、居间的理论——即建构主义。(4)D. Mendonca, M. Curado and S. Gouveia,eds.,The Philosophy and Science of Predictive Processing, Bloomsbury Publishing,2020,pp.xvi, xiv.建构主义对知觉的理解是以生命在环境中的生存和适应为中心的,知觉是有机体的内在认知架构与外部环境相互作用的建构的结果。因此,知觉既是外源的也是内源的,既是被动的也是主动的,既是前馈的(自下而上的或自外而内的)也是反馈的(自上而下的或自内而外的)——它不是由一个线性的而是由一个循环的过程实现的。“在我的脑中,知觉依赖于先验信念。它并不是像在照片或电视上产生图像一样的线性过程。对于我的脑来说,知觉是一个循环的过程。”(5)C. Frith,Making up the Mind: How the Brain Creates Our Mental World,Blackwell Publishing,2007,p.126.

    与传统的标准知觉理论相比,预测加工理论像其他建构主义的认识论一样,赋予生命主体内在的认知架构在认识活动以必要的、恰当的作用和地位,而这种作用是生命主体通过其已有的世界模型(或先验信念)自发地启动对感官刺激的预测实现的。预测加工理论的这一思想很容易让人联想到康德认识论中的范畴(category)及其自发性。事实上,康德的认识论本就与哲学认识论之后出现的心理学和认知科学存在深刻的联系,康德甚至被认为是“认知科学的鼻祖”(6)A. Brook,“Kant and Cognitive Science,” in A. Brook,ed.,The Prehistory of Cognitive Science, NY: Palgrave,2007,pp.117-136.,“康德在理解‘心智是如何认识’这个问题上所做的努力,已经在这个领域中占据了重要的地位。康德对现代心理学也有重大影响。事实上,他提出的许多认识论问题现在正被认知科学所研究,而认知科学的宗旨就在于解开知觉、学习、认识和思维之谜。”(7)D. J. Soccio,Archetypes of Wisdom: An Introduction to Philosophy (Ninth Edition),Cengage Learning,2016,p.333.

    霍威(Jakob Hohwy)、克拉克(Andy Clark)、格拉齐耶夫斯基(Gladziejewski)、斯旺森(Lin R. Swanson)等人认为,预测加工理论与康德思想之间存在相似之处——预测加工“给人的印象是近乎康德式的”(8)A. Clark,“Whatever Next? Predictive Brains, Situated Agents, and the Future of Cognitive Science,”Behavioral And Brain Sciences,Vol. 36,2013,pp.181-253.,它“在精神上为我们呈现了一种康德式的知觉观”(9)P. Gadziejewski,“Predictive Coding and Representationalism,”Synthese,Vol.193,2016,pp.559-582.。特别是斯旺森,他不满于仅仅泛泛地认为“预测加工是康德式的”,而是力图对预测加工与康德心智理论之间的关系做一番深入审查。在“预测加工范式根源于康德”一文中,斯旺森提出:

    (1)预测加工研究中的如此几个活跃的主题——强调“自上而下”的知觉生成;
    “超先验”(hyperpriors,priors over priors)的作用;
    “生成模型”的一般功能;
    “分析-综合”过程;
    想象在知觉中的关键作用——皆与康德心智理论有深刻的渊源。

    (2)预测加工范式可以追溯到心理学家兼新康德主义者赫尔曼·冯·赫尔姆霍茨(Hermann von Helmholtz)的“知觉作为无意识推断”(unconscious inference)”的观点,他认为,这是对康德心智理论的科学实现和印证。

    (3)预测加工不应被视为一种全新的范式,而应被理解为由康德开创、并由赫尔姆霍茨完善的知觉和认知研究进路的最新体现。(10)L. R. Swanson,“The Predictive Processing Paradigm has Roots in Kant,”Frontiers in Systems Neuroscience,Vol.10,2016,p.79.

    但是,奥兰迪(Nico Orlandi)认为,预测加工理论的生态心理学意蕴与康德心智理论不相符,并总结说预测编码的知觉系统不是康德式系统。(11)N. Orlandi,“Predictive Perceptual Systems,”Synthese,Vol.195,2018,pp.2367-2386.本尼(Majid D. Beni)不完全否认预测加工理论中的康德思想渊源,但认为强调康德思想的渊源会使人们忽视预测加工的不同解读之间的差异,并可能导致对预测加工的曲解。(12)M. D. Beni,“Commentary: The Predictive Processing Paradigm has Roots in Kant,”Frontiers in Systems Neuroscience,Vol.11,2018,p. 98.扎哈维(Zahavi)则觉得斯旺森的观点太过轻率,认为预测加工的自然主义与康德的超越论(transcendental)框架的兼容并非易事。(13)D. Zahavi,“Brain, Mind, World: Predictive Coding, Neo-Kantianism, and Transcendental Idealism,”Husserl Studies,Vol.34,2018,pp.47-61.

    为了澄清预测加工与康德心智理论之间的关系,我们将适度考察当前围绕预测加工与康德心智理论之关系的争论。为此,我们会首先阐述预测加工理论的相关概念和要义;
    之后,我们会分析预测加工与康德心智理论的关联和异同;
    最后,我们认为,尽管预测加工与康德心智理论存在跨越历史的呼应,但这还不足以表明预测加工是康德思想的直接历史后承,更不能得出“预测加工根源于康德”这种主张。

    与传统的自下而上的知觉观不同,预测加工非常强调上层模型对可能的刺激的自上而下的预测。预测的观点表明,知觉是主动的、建构的。引申开来的一个更一般的观点是:生命是一个积极的(或主动的)建构过程。例如,拉兹洛(Ervin Laszlo)说,“‘我’的世界是一个被建构的世界,尽管建构常常出错,但我们明白,脑是生命系统的一个有活力的开放的组成部分,它不是被动的照相机,而是一个整体运作的复杂的释译系统,不断地监督和调节生命系统与世界之间的关系。”(14)欧文·拉兹洛:《微漪之塘》,钱兆华译,社会科学文献出版社,2001年,第51页。罗森也明确地说:生命是一个主动的预期系统(anticipatory systems)而不是一个被动的反应系统(reactive system)。“一个预期系统是这样的系统:其当前状态的改变依赖于[对]未来环境[的预期],而不是仅仅依赖于当前或过去的环境。……生物学中充满了这样的情况:有机体能够产生和维持关于自身和环境的内在预期模型,并且能为当前控制的目的而利用这些模型对未来的预期。只有考虑了这些内在的模型,有机体的许多独一无二的属性才会得到真正的理解。”(15)R. Rosen,Anticipatory Systems:Philosophical, Mathematical, and Methodological Foundations (Second Edition),Springer US,2012,p.v.

    知觉的经典理论将脑看作是一个被动的、受刺激驱动的装置。相反,近来越来越多的研究表明,知觉是一个主动且高度选择的建构性过程。没有自上而下的过程,有机体不过是一个应对刺激的反应装置——这样,有机体的主体性就消失了。与这种建构的知觉观相呼应,预测加工理论认为脑不是被动的照相机而是一台进行自发的、主动预测的“机器”。

    基于本文的目的,我们首先从三个方面简要地介绍预测加工理论的基本含义。

    (一)预测编码、模型和预测误差

    脑中信息流的编码方式并不像照相机那样对环境细节做复刻,而是采用预测编码机制。预测编码具有高效节能的特点,是神经学家受电视通讯中的信号传输策略的启发而提出的。电视的前后两个画面经常只有部分差别,比如相同场景下电视中的人物从站着变成坐着。若此时从零开始重新完整地传递两个画面会因为重复而浪费不必要的信道资源,而一种高效的传输方式是只传输第1个画面,然后传输第2个画面与第1个画面的差异。由第1个画面加上新增差异就建构出第2个画面。如果是持续几秒的静止画面,则传输第一幅后,t1、t2时只需传输“与t0画面无差异”。因此,传输前后差异比从零开始重新传输所有信息要高效和节约资源。当初始画面传输后,接收者形成“下一个画面会与前一个大体相似”的期望(expectation)。此期望接着生成下一个画面具体像素值的预测(prediction)。此预测与现实的下一个画面的差别称为差异或误差(error)。(16)C. W. Harrison,“Experiments with Linear Prediction in Television,”Bell System Technical Journal,Vol.31,1952,pp.764-783.“通过仅仅对“意料之外”(unexpected)的变动(即实际值与预测值的偏离)进行编码,一幅图像的代码可以由一个‘充分知情’的接收装置进行有效的压缩。一个最为简单的预测原则是相邻的像素点具有相同的值(如相同的灰度值)……。只要存在可检测的规律性,就可以实时预测,进而可以实施特定类型的数据压缩。我们感兴趣的是实际值与预测值的偏离,它们被量化为实际信号与预测信号之间的差异,即‘预测误差’。这种数据压缩策略大大节约了带宽。”(17)安迪·克拉克:《预测算法:具身智能如何应对不确定性》,刘林澍译,第29页。20世纪80年代,一些脑科学家认为,神经系统也使用了预测编码的传输方式。例如,在神经的自身时序抑制中,持续的光引发神经最初反应后,神经就只产生中性反应或不反应,因为神经系统“预测”接下来也是相同的光强;
    而当光停止,前后差别巨大,神经系统接收到误差,产生抑制反应,表示光停止了,以此节省神经资源。(18)M. V. Srinivasan,S. B. Laughlin and A. Dubs,“Predictive Coding: a Fresh View of Inhibition in the Retina,”Proceedings of the Royal Society of London. Series B. Biological Sciences,Vol.216(1205),1982,pp. 427-459.

    就像电视传输时以刚过去的画面为基准,用来与下一个画面做对比,脑把过去的感官刺激、经历和信息保留和积淀为模型(基本的世界观、事物规律、人际行动规律等),而之后的感官刺激会与已经历过的信息做对比。当然,脑比电视通讯复杂得多。通俗地讲,脑(神经系统上层)因为遗传和过往经历积淀形成一个关于内外环境的模型(包括基础性世界观、当下环境、身体姿态等),这个上层模型主动地向神经系统中层和下层传送预测信号。预测信号是对感觉信号的模拟,即“如果眼前是红苹果,则视网膜上的真实信号应该会是如何”。这些预测信号最后与神经末梢进来的实际刺激比对,如果有较大误差则逐级向上传递误差。此外,这些误差会被赋予不同权重,比如在雾蒙蒙的环境中,视觉误差就被赋予较低权重,因为脑认为雾蒙蒙的环境下的感官刺激的可信度不高;
    而在集中精神的注视时产生的视觉误差就被赋予更大的权重,因为集中精神收集的数据理应有更高精度和可信度。之后,权重足够大的误差会引起上层模型的修改,或通过行动改变环境,继而改变刺激信号,以规避重复的误差,减小模型与环境之间的差异。通过感官提供的非常有限的、不完整的信息,脑基于模型的预测机制创造了关于世界的图像。(19)C. Frith,Making up the Mind: How the Brain Creates our Mental World,John Wiley & Sons,2013,p.85.

    上述是从神经生理层面做出的说明,就日常心理而言,我们可以用如下例子来进行说明。例如,当我远远地看到一个模糊的像人一样的东西向我走来。脑会基于这个形象(“那个模糊的东西是人”这一假设)对那个模糊东西可能的举止进行预测。但随着那个东西越走越近,由于其体姿不变以及其具有的塑料感的肤色纹理等,我会惊异地认识到自己看错了,转而认为“那是人偶”。即由于真人假说与体姿、塑料肤色等之间的巨大差异,脑把“那是真人”的知觉假说修改为那是人偶。如果人偶实际上是真人因行为艺术而故意为之的,那么就会是另一次修正。修正之后,之前的预测误差就会消除。预测加工理论下的知觉和学习机制大体可用下图表示:

    图1 预测加工机制示意图

    预测加工理论中,模型的一个基本功能就是生成预测,因此,模型也称为“生成模型”(generative model)。(20)李恒威:《心智的生命观:从实用主义到预测心智》,《社会科学战线》2021年第9期。

    (二)模型更新并减小误差的过程类似贝叶斯推断过程(21)K. Friston,“The History of the Future of the Bayesian Brain,”NeuroImage,Vol.62,2012,pp.1230-1233.

    生命有机体及其脑具有的模型由遗传而来的本能习性和后天习得的经验组成。要消除感官刺激与有机体既有模型之间的误差,有两种途径:一是,有机体修正其既有的模型,即改变其既有信念或和世界观;
    二是,有机体采取行动,从而引发与既有模型相匹配的新的感官刺激。对于模型修正或更新而言,其过程类似于贝叶斯推断(概率统计学对假说或模型更新的数学刻画),即神经系统进行着近似符合贝叶斯定理——其简易形式为p(h|e)=p(h)× p(e|h)÷p(e))(22)盛骤、谢式千、潘承毅:《概率论与数理统计》(第四版),高等教育出版社,2008年,第18页。——的概率运算。其中p(h|e)表示在新经验e出现后h的后验概率,其值等于脑先前的世界观所含的先验概率p(h)乘以基于新经验e的调整项。比如“物体为人形则这物体是真人”的概率p(z|r)通常大于90%,但人偶工厂中工作的工人的脑中的p(z|r)就低得多。

    以前面的真人和人偶变更为例。设s为塑料肤色,用贝叶斯定理求塑料肤色情况下是真人的概率:p(z|s)=p(z)×p(s|z)÷p(s),p(z)表示所在正常环境中见到真人的概率,这在正常生活情景中通常为0.9。p(s|z)表示真人带有塑料肤色的概率,一般人的脑中此项值为很低的0.01,而彩妆演员则对此见怪不怪。p(s)代表所有塑料肤色出现的概率,包括真人、演员和人偶等,假设其在一般人中的值为0.05。则p(z|s)=0.9×0.01÷0.05=0.18。即塑料肤色情况下仍是真人的概率为0.18(即一般人也仍有极低概率猜测其是涂漆的真人演员)。但多数时候,这种低概率会让我们放弃其为真人的判断,转而判断其为人偶,即更改自己的环境模型。

    (三)近似贝叶斯推断过程中所需的自由能函数以及自由能原理(23)K. Friston,“The Free-energy Principle: a Rough Guide to the Brain?”Trends in Cognitive Sciences,Vol.13,2009,pp.293-301.

    有机体以减小预测误差的长期平均值方式进行近似的贝叶斯推断。自然生命中的贝叶斯推断非常难解,只能以变分贝叶斯方法做逼近计算。而自由能是变分贝叶斯中的一个概念,因此也叫变分自由能。弗里斯顿定义自由能的原因是误差(惊异情形)的长期平均值难以获得,但其上界在数学上可以确定。自由能函数的表示方式之一为F(s, u) = Dkl ( q(φ|u) ||p(φ|s, m) ) - log p(s|m),(24)K. Friston,“The Free-energy Principle: a Unified Brain Theory?”Nature Reviews Neuroscience,Vol.11,2010,pp.127-138.; K. Friston,“A Free Energy Principle for Biological Systems,”Entropy,Vol.14,2012,pp.2100-2121.其中等式右边的左半部散度函数为正数,右项-log p(s|m) 代表了误差的长期平均值,F(自由能)≥误差的长期均值(-log p(s|m))。误差的长期均值等于信息熵,因此,减小自由能并维持熵小状态也等于生命维持在限定的健康状态集中(生命和脑在其所有可能状态空间中集中于特定有益区域,而不是均匀的高熵分布),这也意味着生命抵抗各种不健康状态。由此,通过取上界以及变分贝叶斯逼近的方式,神经科学家和预测加工理论家得以用数学刻画生命和脑的一般原理:自由能原理。生命、脑等自组织和适应系统在数学刻画上都以减小自由能为目的,或者说,生命和脑抵抗死亡、维持非死寂的稳定状态的方式在数学形式上表现为减小自由能,宏观上表现为通过改变模型以适应环境,或以行动直接改变环境以获得与模型匹配的刺激。因此,自由能原理是个试图统一解释生命、脑和心智的富有雄心的原理。从这个抽象的最终原理回过头来看,脑实际上是通过减小自由能的方式而表现出其在进行着近似贝叶斯推断,因此脑是贝叶斯机器的论题其实是自由能原理的推论。(25)K. Friston,“The History of the Future of the Bayesian Brain,”NeuroImage,Vol.62,2012,pp.1230-1233.预测加工理论也因此具有心智生命观的意蕴。

    知觉是脑的上层模型自发、主动的下行预测与上行的感官刺激相互作用建构的结果。这种知觉观令人联想到康德对理性主义(推崇理智概念)和经验主义(推崇感官经验)的调和。脑中的世界模型,以及模型中的抽象元素使人联想到康德的知性(understanding)范畴,自上而下的加工使人联想到康德的范畴和概念对感性直观的加工,层级预测使人联想到康德的三重综合(感性的直观综合、想象力的综合、知性的概念综合)。克拉克说到“知觉涉及使用已有知识结构(康德式范畴和概念)去预测一串串感觉输入”(26)A. Clark,“Radical Predictive Processing,”South. J. Philos,Vol.53,2016,pp.3-27.。具体的与康德的知性概念相近的是预测加工中的“超先验”(27)A. Clark,Surfing Uncertainty: Prediction, Action, and the Embodied Mind,Oxford University Press, USA. 2016,p.174. 关于“prior”翻译有很多争论,本文把“prior”译为“先验”,把“transcendental”译为“超越论的”。。超先验指的是一些抽象的知觉规则,比如物体被遮掩后也持续存在、相近的多个感官刺激会有单一的原因或最佳解释等。霍威认为,“知觉是当脑利用其对世界的先验概念(空间和时间的直觉形式,以及诸范畴等)来组织感官系统面对的混乱的感官杂多时产生的,这一观点当然也有显著的康德主义成分”(28)J. Hohwy,The Predictive Mind,Oxford,2013,p.5.。格拉兹耶夫斯基(Gladziejewski)说到,“预测编码的知觉观具有康德精神,知觉是自发的解释活动。”(29)P. Gadziejewski,“Predictive Coding and Representationalism,”Synthese,Vol.193,2016,pp.559-582.斯旺森明确地提出预测加工范式根源于康德。(30)L. R. Swanson,“The Predictive Processing Paradigm has Roots in Kant,”Frontiers in Systems Neuroscience,Vol.10,2016,p.79.总结地看,预测加工与康德心智理论的关联表现在两者都强调知觉的自上而下特征、自发性和主动性。具体可分为四点。

    第一,两者都强调知觉印象(percepts)的自上而下的产生。传统的洛克、休谟的经验主义和原子主义心理学认为观念是感官接收到的感觉原子的自下而上的组合(线条、色块组成形状和物体)。预测加工反驳了感觉原子组合的观点,认为如果没有上层自发的、主动的预测的话,感觉原子没法被组合,这呼应了康德的“直观无概念则盲”的上层知性的自发性和主动性。霍威在强调知觉的自发性和主动性时甚至说感觉输入最好被构想为是“对脑发出的询问的反馈”(31)J. Hohwy,The Predictive Mind,Oxford,2013,p.2.,即感官刺激只是对上级脑皮层的预测信号的检测。这把感官刺激放在不重要的位置,因而与经验主义的刺激印象为先的观点极为不同。

    第二,两者都有“超先验”。脑内模型发出的预测并不是随意的,而是被既有概率所约束,既有的概率约束称为先验(来自遗传和习得积累下的经验、知识、习惯等),超先验是先验的先验,是更抽象、更根基的先验。房间里的声音最有可能来自家人、空中飞影应该是鸟而不是狗,这些是先验;
    同一时空应该只有一个事物、人不能同时左转且右转,这些是超先验。“我们具有关于世界更一般性的知识,这使得以上‘混搭’并不会成为多么强大的假设——因为这些更一般性的知识告诉我们(比如说),房子和人脸不会在同一时间以同一大小出现在同一个地方。此类知识本身可以被视作系统性先验(systemic prior),尽管这种先验的抽象程度相对更高,我们有时称其为超先验”(32)安迪·克拉克:《预测算法:具身智能如何应对不确定性》,刘林澍译,第40页。。斯旺森说这些特定的超先验类似于康德的的时空直观形式。直观形式规范了直观,超先验规范了知觉预测。有机体的模型和模型中的元素对应着康德的各种概念。斯旺森还提到一种神经学式观念论,援引霍夫曼(Hoffman)和普拉卡什(Prakash)的“客体和时空只是物种特有的知觉适应”,知觉只提供“现象”而非“物自体”(33)See L. R. Swanson,“The Predictive Processing Paradigm has Roots in Kant,”Frontiers in Systems Neuroscience,Vol.10,2016,p.79.。但这种神经学式观念论并非主流,而且其在认为所见之物不是物自体时,却又矛盾地认定有机体及其脑是实在的物自体。

    第三,生成模型生成的抽象预测对应着康德心智理论中想象力生成的图式。康德在处理概念如何应用于直观时引入了作为中介的超越论想象力(transcendental imagination)和其产生的图式(schema)。想象力是感性、知性之外的心智的第三种功能。“想象力是一种先天地规定感性的能力,……[是]知性在我们所可能有的直观的对象上的最初的应用”(34)康德:《纯粹理性批判》,邓晓芒译,杨祖陶校,人民出版社,2004年,第101、140、101页。。类似地,在预测加工中,上层生成模型与底层刺激中间存在多层预测,某些层次的抽象预测类似于康德的图式。由此,预测加工的模型、预测、刺激可对应康德的知性以及范畴、想象力、感性直观。以狗的概念为例。“狗这个概念意味着一条规则,我们的想象力可以根据它来普遍地描画一个四足动物的形状”(35)康德:《纯粹理性批判》,邓晓芒译,杨祖陶校,人民出版社,2004年,第101、140、101页。,狗的图式能适用于各种各样的现实狗。由此,在康德这里是狗的概念、狗的图式、具体狗的感性材料,而在预测加工这里对应的是狗的生成模型、狗的抽象预测、具体狗的感官刺激。

    第四,想象在知觉中的关键作用。在预测加工中,想象力是使得生成模型促进知觉的引擎,生成模型是一种构架,想象力以此构架生成预测,想象力的运转需要生成模型构架,这正如人工智能巨擘辛顿(Hinton)的文章名《要识别形状,首先要学会生成图像》(36)G. Hinton,“To Recognize Shapes, First Learn to Generate Images”,Progress in Brain Research,Vol.165,2007,pp.535-547.所显示的。克拉克也写道,“知觉(至少在像我们这样的生物身上出现的知觉)是与想象力(或类似想象力的东西)共同涌现的。”(37)A. Clark,“Perception as Prediction,”in Perception and Its Modalities,New York, NY: Oxford University Press, 2015,pp.23-43.对应地,康德的想象力在其知觉理论中也有相似地位。康德指出生成性想象力是综合的关键,而综合是知觉和知性的基础,进而想象是知觉的基础。(38)康德:《纯粹理性批判》,邓晓芒译,杨祖陶校,人民出版社,2004年,第101、140、101页。

    推崇预测加工与康德的关联的学者认为两者的桥梁是赫尔姆霍兹。早期生成模型的研究者达彦等人(Dayan et al)写道,“继赫尔姆霍兹之后,我们将人类的知觉系统视为统计推理机”(39)P. Dayan,G. E. Hinton,R. M. Neal,R. S. Zemel,“The Helmholtz Machine,”Neural Computation,Vol.7.5,1995,pp.889-904.。弗里斯顿(40)K. Friston,“The History of the Future of the Bayesian Brain,”Neuroimage,Vol.62,2012,pp.1230-1233.、克拉克、霍威等人也把预测加工追溯到赫尔姆霍兹。(41)See A. Clark,“Whatever Next? Predictive Brains, Situated Agents, and the Future of Cognitive Science,”Behavioral and Brain Sciences,Vol.36,2013,pp.181-204.其中一个理由是,相同的感觉刺激可以对应多种可能的环境情况,因此,脑必须主动地推断和预测出最正确的外部情况。另外一个理由是,末梢刺激经过神经通路到达脑部时必然已不同于原初了,因而不是对环境的复制。赫尔姆霍兹的见解启发了认知心理学中的“以综合进行分析”的学派,也启发了人工智能深度学习的反向传播算法(42)See A. Clark,“Whatever Next? Predictive Brains, Situated Agents, and the Future of Cognitive Science,”Behavioral and Brain Sciences,Vol.36,2013,pp.181-204.。赫尔姆霍兹则把他的观点追溯到康德。(43)H. Helmholtz,“Treatise on Physiological Optics [Translated from the 3rd German ed. Edited by J.Powell],”Rochester: Optical Society of America,1925,p.2.由此,一些学者认为,存在一条从康德经赫尔姆霍兹到预测加工的思想演化链条。

    上述论及的预测加工与康德心智理论的相似和关联未曾涉及预测误差、模型来源、模型更新等关键概念。虽然预测加工的上层模型类似康德的范畴和概念,感官刺激类似康德的感性,但上层模型至少有两点不同于康德范畴,一是模型来自有机体及其脑的演化历史以及有机体的成长经历,而康德的十二范畴是固定的。另外,上层模型与感官刺激的交互中的预测误差是康德的范畴综合感性的过程所没有的。此外,预测加工理论与康德心智理论之间还有在超越论框架、统觉、自我意识等方面的差别。具体说来,两者至少有如下四个差别。

    第一,康德心智理论属于内部主义认知观(认识由天生固有的理智概念引导),但预测加工则有明显的外部主义特征。预测加工大体可分为霍威某一时期的内部主义的、神经中心主义版本(44)J. Hohwy,“The Predictive Processing Hypothesis,”in The Oxford Handbook of 4E Cognition,2018,pp.129-146.和克拉克的外部主义版本。内部主义版本的预测加工不强调脑的演化历史、脑的具身性和环境依赖性,因而与康德的关联更大。但这种内部主义版明显是不完整的,因此强调演化史和具身性的外部主义版本更加可信。这种外部主义的预测加工有很多吉布森(James J. Gibson)开创的生态心理学的影子,而生态心理学又深受杜威和梅洛庞蒂等人的影响。如此,康德的认识论思想在这方面的影响就变得次要了。

    具体地说,康德心智理论更多是主体内部理智概念主导的操作,范畴是天生和固定的,与经验无关。但预测加工的模型不是天生和固定的,涉及演化史和经验积淀。其运作方式也不尽是模型指引下的操作,预测加工并非单方面强调从上到下的预测,脑的上层模型和模型生成的预测两者本身的建成就需要底层的信息,模型更多是由底层环境刺激和生物演化所选择的。再者,具体运行中,底层信息和上层模型也处于动态沟通中。而康德的范畴和直观形式对感性杂多具有绝对的领导地位。另外,脑中预测编码需要奠基于外部自然场景统计学(statistics of natural scenes)以及自然场景产生的从下到上的输入的类型的统计学。外部环境本身带有确定性和信息,并非高度不确定。霍威等人的早期的预测加工版本过分强调了知觉机制中的不确定和噪声处理,进而过分强调脑内加工的理智主义和康德味道。而一旦澄清了自然环境本身的确定性和自下而上的重要性,康德的味道就会减少。

    在预测加工的不同版本中,奥兰迪认为预测加工也是具身的(embodied)、生成的(enactive)、嵌入环境的(embeded)、延展的(extended),乃至是生态的(ecological)。(45)N. Orlandi,“Bayesian Perception is Ecological Perception,”Philosophical Topics,Vol.44,2016,pp.327-352.克拉克持类似看法:“在预测加工范式下,神经加工过程嵌套在一个宏大的、错综复杂的行动网络之中,这些行动是具身的,并且与现实世界紧密关联。在分析各类常态性与病理性现象时,预测加工模型能为我们理解人类经验的形式与结构提供更多启迪,并能与自组织、系统动力学和具身认知领域的相关研究建立起横向的联系。”(46)安迪·克拉克:《预测算法:具身智能如何应对不确定性》,刘林澍译,第3页。而康德心智理论与“4E认知”有多处冲突。比如康德不认为身体和环境是心智的构成要素,也不会像延展认知那样认为纸笔是构成认知系统的一部分。虽然部分预测加工学者认为知觉是自发性的解释活动,但更多的学者认为不能低估刺激的作用,因为脑内模型和预测来自受环境选择的遗传(包括脑特征和身体特征)和后天收到的刺激和学习,脑内模型是有机体在适应环境过程中形塑而成的。奥兰迪强调预测编码要与环境场景统计学相结合,由环境引起的感性杂多并不是混乱的,而是有统计学规律和结构的,脑对特定的线条组合起反应,是因为这线条组合在我们灵长类祖先的生活环境中有特定意义,而非随意出现。甚至可以说,脑的结构和机制之所以如此,那是因为地球环境本就如此。而康德认为感性杂多在未经处理前是混乱的、无意义的、无法指明物自体世界。另外,感官刺激与现实世界并非分离,赫尔姆霍兹以新康德主义的口吻说“我们只通达感官刺激,而没有直接通达环境”。但这其实是把我们等同于我们的脑,但“我”不是脑,4E认知解读下的“我”直接连着环境,不局限于脑,甚至也不局限于皮肤。正如4E认知的先驱梅洛-庞蒂所言,我是身体性的存在,主体即身体,而康德的心智理论中忽略身体。因此,坚持预测加工与4E认知、生态认知存在强关联的奥兰迪认为预测加工理论主要不是康德系统的。(47)N. Orlandi,“Predictive Perceptual Systems,”Synthese,Vol.195,2018,pp.2367-2386.

    第二,预测加工与康德理论在预测误差概念上有差别。高层模型与感官刺激之间的预测误差对于预测加工理论而言至关重要,而在康德的心智理论中并无对应的论述。康德既没提到想象力与感性直观的预测误差,也没有最高级知性范畴与想象力之间的预测误差。其实康德在《判断力批判》中有过类似预测误差的说法,即滑稽作为预期错误的结果:“笑是一种紧张的预期突然转变成虚无而来的情绪。这种不会使知性感到高兴的转变,间接地使人在一瞬间高兴”(48)康德:《判断力批判》,李秋零译注,中国人民大学出版社,2010年,第155页。。但康德并不把这个涉及审美情感的预期失算作为心智的普遍因素。或许有人会替康德辩护,从心智对世界的表征和实在世界本身之间的不匹配,即错误认识世界的情况,来替康德寻找其理论中与预测误差的对应项,从而通过对康德的合理阐发使其理论能容纳预测误差。按此理解,减小误差等价于一步步减小关于世界的错误认识,增进正确认识。但预测加工中的预测误差主要是生命系统过去已获得的信息与当下刺激信息之间的不匹配,而不在于高级的对世界的语言命题式的信念,而且生命在减小误差的过程中直接涉及的是有用性,直接目的是趋利避害,而非获取世界“真相”。

    第三,预测加工的自然主义与康德哲学的超越论框架并不容易兼容。扎哈维在其文章的一句脚注里稍微提及这点。(49)D. Zahavi,“Brain, Mind, World: Predictive Coding, Neo-Kantianism, and Transcendental Idealism,”Husserl Studies,Vol.34,2018,pp.47-61.预测加工所属的自然主义认知科学预设世界的客观性,因此不怀疑也无需去论证世界的客观性。而超越论哲学试图解释和论证世界的客观性,试图严格地反驳怀疑主义。康德这样定义超越论——“我把一切与其说是关注于对象,不如说是一般地关注于我们有关对象的、就其应当为先天可能的而言的认识方式的知识,称之为先验的”(50)康德:《纯粹理性批判》,邓晓芒译,杨祖陶校,第19页。其中的“先验”等于本文的“超越论”,参见倪梁康:《Transzendental:含义与中译》,《南京大学学报》2004年第3期。[即本文的超越论的]。因此康德的超越论哲学是研究对客体的认识方式,探讨对世界的客观认识的来源,并最终把客观知识追溯到我们心智的结构上。因此,超越论哲学探索何为客观性,何为“独立于心智”或“超出心智”。康德《纯粹理性批判》是服务于其超越论哲学的。实用主义哲学家詹姆斯(William James)也持有相似看法“我们对实在有什么样的看法,就要看我们通过什么视角来看待它。实在的存在是它本身的事;
    但实在是什么则取决于用什么样的视角;
    而采取什么样的视角则要取决于我们自己。实在的感觉部分和关系部分都是无声无息的;
    它们绝对不可能说自己是什么。正是我们才是为它们说话的人。”(51)威廉·詹姆斯:《实用主义:一些旧思想方法的新名称》,李步楼译,商务印书馆,2009年,第138页。简言之,超越论哲学探讨何为客观性,并且其结论是客观性和主观性相互依赖,不能把主观性、心智、意识等彻底还原为物理学、生物学等自然科学,因此也叫超越论观念论(transcendental idealism),但同时反对经验观念论(或主观观念论)。

    康德这样定义自己的超越论观念论:“先验观念论是这样一种学说,依据它我们就把一切现象全都看作单纯的表象,而不是看作自在之物本身,因此时间和空间就只是我们直观的感性形式……相对立的是先验的实在论,它把时间和空间看作某种自在地(不依赖我们的感性)被给予的东西。”(52)康德:《纯粹理性批判》,邓晓芒译,杨祖陶校,第324、405页。康德这里作批评的“先验实在论”就是预测加工等自然主义科学通常所隐默认为世界时空完全与主体无关的观点,而康德认为“先验实在论”是常识的偏见、常识的错误预设。一切事物要有意义,包括“存在”意义,就必须要涉及主体,完全不涉及主体的“客观存在”其实也无法被理解。同时要说的是,康德的超越论观念论也不同于贝克莱等人的经验观念论。“[经验]观念论由于它假定了空间的特有的现实性,它就否定了广延的存在物在空间中的存有……它甚至还主张,只有内部的经验才惟一地充分证明了其客体(自在本身)的(连同这一切时间规定的)现实存有。”(53)康德:《纯粹理性批判》,邓晓芒译,杨祖陶校,第324、405页。经验观念论认为我们只能知道自己心中的经验,贝克莱的存在即被知觉,也即存在即知觉经验的总和。简单地说,康德的超越论观念处在极端客观主义与主观观念论之间,类似于概念范畴实在论,即世界是实在的,但总是被范畴、概念所塑造,也因为被塑造,对象也总是符合我们的范畴等认知结构。一方是贝克莱等的观念论,另一方是极端的客观实在论,而康德处于这两者之间。

    不过,部分预测加工理论家和神经科学家也有思考世界客观性问题,认为世界的样貌与进行认识活动的高级器官(即脑)的结构有关。比如神经表征主义者认为,我们的知觉对象只是表征,而不是事物本身,脑构造了世界的表征。“如果我们有机体被设计的结构不同,那么我们关于周围世界的构造也将是不同的。我们不知道,而且将来也无法知道,‘绝对的’实在到底是什么样的。”(54)A. Damasio,Descartes’ Error: Emotion, Reason, and the Human Brain,New York: G. P. Putnam’s Son,1994,p.98.“大量输入模式纯粹靠巧合而反复出现在同一关系中的机率微乎其微,可预测性以特定的方式说明了世界上不同的事件是相互联系着的。因此,我们体验世界序列的依据就是世界的真正结构以及脑皮层所记忆的内容。当然,我们在任何一刻只能直接知觉这个世界的一小部分,并通过这一小部分来唤醒与之相关的记忆内容,因而,对‘什么是现实’的回答很大程度上取决于脑皮层建立的模型能在多大程度上反映世界的真实情况。”(55)杰夫·霍金斯:《人工智能的未来》,贺俊杰等译,陕西科学技术出版社,2006年,第208页。这些看似很像康德所说的知识既不纯粹由作为客体的刺激决定,也不纯粹由能够做出反应的主体决定,而是来自这两者相互作用中的建构。那么,这种神经表征主义是某种形式的超越论吗?应该不是,因为其缺乏认识论的严格分析,(56)D. Zahavi,“Brain, Mind, World: Predictive Coding, Neo-Kantianism, and Transcendental Idealism,”Husserl Studies,Vol.34,2018,pp. 47-61.比如神经表征主义者认为由脑构造的世界表征可能是假,但却预设脑科学为真。这些神经表征主义者隐含地认为对脑科学比描述世界的物理学更基础。所以,即便预测加工引入神经表征主义也仍然与超越论框架有分歧。自然主义、神经表征主义都默认存在“事物本然的样子”。对此,我们想稍加引申地说,认识(以及认识的结果——知识),必然是与人相关的;
    因为,知识的发生是这样的:知识是在主体与客体相互作用时、在主体内形成的对客体的表征;
    而主体形成客体表征的目的在于服务于主体,因为主体本然是一个价值、目的和意义性的存在,离开了价值、目的、意义这样的概念,主体也就无法理解了;
    任何相互作用都是一种触动、影响,并且必然会带来改变——无论多么微小,因此,人类无法不经过这个相互作用而先验地知道事物不受这种相互作用影响的本然的样子。正因为如此,并没有认识论意义上的事物的本然的样子,所有知识——无论是意见,还是真理或谬误——都隐含了人类本性和人类形象于其中,而这就是人本主义的根本所在,或者也是超越论的旨趣所在。

    第四,两者还有一个涉及康德的综合与统觉关系的分歧。康德理论中,综合过程不仅建立了知觉和认识,也建立了统觉(apperception)和自我。先验想象力对直观杂多的综合性构成统觉和自我意识的基础。“综合是呈现杂多所需要的,也是自我意识所需要的”,即那个把红色、圆形粘连为同一个物体的两个特征的综合,也是那个把一串串表象粘连为都是“我的表象”的综合。可以用如下例子简单说明:为了看到一本封面有橙色和棕色的书,主体心智要先把握(并分列登记)这片橙色块和那片棕色块(感性综合),这二个色块就叫感性杂多。这份感性杂多不是多个东西的简单综合,而是心智在把握其它新感觉材料时,同时保留(或通过想象重新再造)之前的感觉材料。然后心智按照书的概念去把这些感性杂多综合为完整的一本书(概念综合)。这过程需要一个统一且同一的意识。(57)S. Kaufer and A. Chemero,Phenomenology: an Introduction. John Wiley & Sons,2015,p.22.而预测加工未在知觉理论中谈及自我意识与意识的统一,倾向于把自我意识和具体的心智活动分离开,作为单独议题进行研究。在这个方面,康德或许可以给预测加工以某种启发。

    康德是心理学、认知科学(心智科学)的伟大先驱,其心智理论强调了心智的先天结构和自发性。主流心理学因受经验主义的强烈影响,在某种程度上更加关注感官刺激的自下而上的作用。在此背景下,因强调模型及其主动预测的预测加工理论很容易让人联想到康德,因为两者都认为认识不是被动反映的单向作用的结果。这也显示了康德心智理论的开创性、洞见性和迁移性。但预测加工与康德心智理论之间的关系要比“预测加工源于康德”这个断言要复杂。事实上,预测加工理论的崛起与通讯中的预测编码、脑科学、计算神经学和人工智能中的机器学习等科学方面的进步有更加直接的关联。此外,预测加工的模型、预测和预测误差也与康德心智理论有较大差异:模型比康德的知性范畴和概念复杂,预测比康德的图式更广,预测误差则在康德理论中没有对应项;
    再者,康德心智理论还缺乏预测加工所具有的具身性、生态心理学、外部主义和生命心智连续性等的意蕴。反之,预测加工也缺乏康德认识论哲学中极为鲜明的超越论维度。

    猜你喜欢 先验心智康德 《发现大脑:谁开启了我们的心智之旅》书评自然杂志(2022年2期)2022-08-18默:从人生态度到审美心智社会科学战线(2022年1期)2022-02-16一类低先验信息度的先验分布选择研究陕西理工大学学报(自然科学版)(2021年3期)2021-06-23纯接受性的被给予?——康德论自我刺激、内感觉和注意哲学评论(2018年2期)2019-01-08甘露珠宝 匠心智造,创新引领未来中国宝玉石(2018年4期)2018-09-07艺术百家电影文学(2017年15期)2017-12-26基于自适应块组割先验的噪声图像超分辨率重建自动化学报(2017年5期)2017-05-14康德审美判断的先验演绎与跨文化交流中国诠释学(2016年0期)2016-05-17康德是相容论者吗?哲学评论(2016年2期)2016-03-01对康德空间观的误解及诘难的澄清与辩护哲学评论(2016年2期)2016-03-01

    推荐访问:康德 辨析 心智

    • 文档大全
    • 故事大全
    • 优美句子
    • 范文
    • 美文
    • 散文
    • 小说文章