Permanent link to archive for 2/13/03.2005-2-14
联结主义理论与传统认知理论的区别
    联结主义是一种新的认知理论。与传统认知理论相比,联结主义更加注重人脑的学习机制和知识存储,具有较强的生物有效性;联结主义在计算机模拟研究上也有了很大发展,特别是最近几年,很多研究者已经注意到语言材料在计算机模拟研究中的直接应用,比如在表征上采用了一些基于语言数据库的统计方法,能够对大量的词语进行表征。

    一、模块理论与联结主义理论

    传统的认知理论是一种模块化的理论。模块理论认为,人脑是处理符号系统(symbolsystem)的机器(Newell,1980)。模块理论的原始假设早在18世纪就由FranzGall提出,现代心理学对模块理论表述得最完备的莫过于Jerry Fodor(1983)。Fodor认为人脑的认知系统是由许许多多的模块组成的。这些模块有的负责语法,有的负责视觉,有的负责听觉,任务专一(domain-specific)而且互相独立(autonomous)。

    模块理论的线性次序,及其分明的层次,对认知科学家具有极强的吸引力。但是,近十几年来它也受到了强烈的挑战。对其挑战的主力军当属联结主义了。

    联结主义理论在形成的初期就和模块化理论针锋相对,比如Rumelhart和 McClelland(1981)提出的“交互作用模型”(interactive activation),这个模型假设语言的加工过程不仅包含自下而上的加工过程,也包含自上而下(top-down process)的过程。而且这两种过程可以在同一时间互相作用,其中最著名的就是Rumelhart和 McClelland所举的“词优效应”(word-superiority effect)的例子,这是自上而下的加工过程的很好的证明。

    二、联结主义理论的特征

    按照Rumelhart,McClelland,和PDP Group (1986)的PDP (Parallel Distributed Processing)理论,联结主义有以下两个基本特征。

    (1)在知识表征(representation)方面,它强调“分布表征”(distributed representation)。分布表征与传统认知理论对知识的表征有很大的不同。

    传统认知理论将人脑看作是符号处理系统,因而它采用的是“方位表征”法(localist representation)。这种表征的基本特点是一个信息加工的单位(或单元)只表达一个概念(例如语素,字,或词),而一个概念也只由一个单位来表达。这样,表达单位不能进一步分解为更小的单位,因为它与概念间有清楚的一对一的关系,而每个单元本身并不能有效地表达一个信息。

    “分布表征”与此不同,它强调一个概念由多个单元互相作用的关系来表达。例如,英文大写字母F和E之间的不同在于后者多了一横。照方位表征法,F和E是分别由两个不同的单元来表达的。照分布表征法,F和E可以由多个同样的单元来表达,所不同的某些单元在表达E时被激活,但在表达F时被抑制。这样一来,我们如果仅看这些个别的单元,它们既不表达F,也不表达E。F和E的知识是由多个单元之间激活的关系来表达的。

    (2)联结主义区别传统认知理论的第二个基本特征在于它对知识学习的看法。心理语言学家一直以来认为学习语言就是一个学习规则的过程。这种观点,由前所述,与乔姆斯基的语言学理论是密不可分的。

    联结主义则认为,乔氏理论提供了有效的规则系统描述语言本身,但这系统不能描述学习的过程。由于联结主义采用分布表征,它认为:

    知识学习的过程就是学习分布表征的过程。
    学习是经过调节单元与单元之间的关系来完成的;
    而调节单元与单元之间的关系又是经过改变单元与单元之间的权值(weight)来完成的。
    权值是表达单元与单元之间联结的强度。权值数越高,单元之间的联结就越强。一旦联结网络中相应的单元都由适当的权值联系好了,知识的表达和学习的过程也就完成了。

    如果我们已经学会了F这个字,学习E时只需要将最下部分的单元激活并给予高强度权值,将其与网络中其它单元联结起来,我们便学会了E。        

    总之,联结主义理论与传统的认知理论有很大区别。它所运用的基本概念都与人脑的生物机制有一定程度上的对应关系。例如单元对应于神经元,单元的联接对应于神经元的联接,权值对应于联接强度,激活与抑制对应于神经元间电生理活动的方式。如何能够利用单元、联接、权值、激活与抑制这些概念去更好地解释传统认知理论中的重大问题,乃是联结主义理论成功的关健。

    联结主义在词汇识别研究方面的主要理论是:词汇识别包括音、形、义三种编码的计算,每种编码都采用分布表征的方法,不同的激活对象被编码为不同的激活模式。加工由多层网络完成,不同层次和相同层次之间有着兴奋性和抑制性联结,联结的权重通过网络的学习获得。

摘自:邢红兵 汉字习得的自组织模型
15:18, #, By xp
读书:他山之石