人脑短时记忆机制同人类语言结构的关系

发布时间：83年09月28日

陆丙甫

前言

早期的“惟理普遍语法”，完全根据逻辑关系去进行语法分析，强调各种语言的结构一致性，用一个固定的框架往各种语言上套，主要也就是用拉丁语的语法范畴往其他语言上套。例如，由于以拉丁语中主语、宾语等一套句法成分范畴为分析语段结构的前提，对于汉语“台上坐着主席团”这样的句子就产生了长期的争论：有人认为“台上”是状语，“主席团”是主语，也有人认为“台上”是主语，而“主席团”相应地就成了宾语或补语等等。其实，汉语中由于没有主格、宾格等形态变化的标志，“主语”“宾语”等范畴对于汉语是否必要、适用，或在汉语中是否存在都是个问题。惟理普遍语法认为人类的逻辑思维结构既然一致，人类语言的结构也应一致。这个时期语言学家强调的是人类语言结构的普遍性。

随着文化人类学的发展，语言学家对人类语言的多样性日益重视，于是放弃了惟理语法，开始强调如实描写各种语言的特殊性，这就是本世纪三十年代成熟定型的“描写语言学”的路子。在美国，由于“抢救”记录千差万别的各种印第安语言的需要，这一派的研究更为发达。描写语言学认为，各种语言中使用的语法范畴是极不相同的，认为人类语言千差万别，无奇不有。这个时期，语言学家强调的是人类各种语言之间的差异性。

近二十多年来，语言学界对语言普遍性的兴趣又在回升，不过这一次对普遍性的认识在深度上已和惟理语法阶段大不相同。今日语言学家关心在深处起作用的系统性的“隐性”普遍规律远甚于那些表面的单因素的“显性”普遍现象。所谓“隐性规律”是指“万变不离其宗”的变化规律。这种变化又是多元素的，即由若干元素组成的一种结构系统转换成由不全相同或完全不同元素组成的另一种结构系统、表面上看不出两个系统间的一致性，但其实彼此内部的结构关系却有某种一致之处。例如电报“滴搭”声组成的电码同日常语言表面上毫无一致性，但既然能互相转译，可见它们内部的结构是一致的，不过这种一致性外行人看不出。不同语言间的一致性比同一语言的自然形式和电报编码之间的一致性复杂得多，证据之一是电文和口语之间可进行机械的死译，而不同自然语言间的翻译要复杂得多。

由这种内部结构一致性所决定，每一系统内部的各元素之间必然有种种约制关系。事实上，要发现各种语言间那种极其深刻隐蔽的一致性，主要也就是通过整理和解释各别语言内部各元素间的互相制约性。例如，语言学家发现，具有某些语音特征的语言往往或全都具备一系列相对应的语法特征，或者具有某些语法特征的语言往往或全都具有另一些相应语法特征（Greenberg. J. 1963）。但仅仅发现这种相关对应是不够的，若不对其加以解释，找到必然性的原因，则这种相关：对应也可能是纯粹偶然的巧合。科学的一个重要目的正是要越来越深刻地发掘出深藏在表面现象背后的普遍一致性，并且要寻找，这种一致性的客观必然性。

无疑地，人类语言现象同人类大脑机制有着千丝万缕的联系。可以说语言行为是一种高级的心理现象。人类心理机制既然是基本相同的、那么人类语言必然受到人类共同心理机制的制约而表现出许多普遍规律。并且这些普遍规律也应该可以通过心理学原理得到解释。近年来兴起的心理语言学这门边缘科学，企图走的正是这样一条路子。

在人类心理机制同语言的种种联系之中，短时记忆（short term memory或immediate memory）机制对语言结构的影响是特别重要的。在语言交际过程中，说话者在说完一句话之前，要把自己说过的词语暂时记住，或者还要把某些将要说出的词语暂时记住；听话者在听完一句句子前，也要把已听到的词语暂时记住。总之，造句、析句的过程对短时记忆能力的运用是十分明显的，并且无疑地，人类语言结构也会表现出适应我们记忆机制的，或者说便于我们记忆的某种普遍特征。

三个前提

2.1语言实体的可切分性和结构性

研究任何问题都要先承认某些个大前提，或者说出发点、进行观察时的相对稳定的立足点，坐标系统的原点。

我们的第一个大前提是：人类语言实体的可切分性。蜜蜂也可利用“舞蹈”传达信息，进行交际，用舞姿表示蜜源方向，用飞行速度表示蜜源的距离。但是这种语言是不可切分的。例如速度越慢表示距离越远，其变化是“无级可调式”的渐变。而人类语言不是这样，无论是“五百米之外｜有｜花蜜”还是“一万里之外｜有｜花蜜”，两句句子都由三个基本部分组成，也就是说可以首先切分成明确的三部分。有切分即意味着可排列组合，人类语言近乎无限的表达力，正是来源于语素（最小的音、义结合体，大致相当于汉语的“字”）排列组合的无限可能性。

可切分，可排列组合，也就意味着人类语言实体是有“结构性”的，因为所谓“结构”，就是各组成部分之间的关系。反过来说，有结构的实体必然可以切分成若干组成部分。而且这种切分不应是任意的，它应该反映出结构的特点，为结构模式类型所规定，也就是说，切分的程序和结果应该具有客观必然性。例如，下面这个句子我们绝对不能切分成“五百米之｜外有花｜蜜”三部分。我们说蜜蜂语言不可切分，正是从切分没有必然性这一点来说的，严格地说也就是“不可明确切分”。无级渐变实体，即便可切分的话，这种切分也是任意性的、偶然性的，或者是无限等分的切分，而可以无限等分切分实际上是不可分。

2.2结构模式和结构项的有限性

我们进行研究的第二个大前提是：人类语言的结构系统是有限数量的结构模式组成的有限元集合。

人类语言的一个最奇妙之处就是能够以有限的元素：音位、音节、语素、结构模式来表达无限的思想。说话者运用有限的元素为手段，可根据需要随时创造出新的句子来，这就是语言的创造性。

如果说作为语言手段之一的结构模式是有限的，那么组成每个模式的元素的数量也应该是有限的，即每个模式都是一个有限多项式。并列结构似乎是个例外，可以是两项成分的并列，也可以是三项、四项……n项的并列，但是所有这些并列结构应该看作同一个模式类型 · 其实这种模式可看作由两个基本元素组成：xⁿ，x表示某个聚合类（名词、动词、形容词等类别），n表示此类成分的个体出现的个数。其次，我们下面3.4节会谈到，由于人脑记忆机制的限制，在自然语言中，n也必然≤g。

2.3语言结构与大脑短时记忆机制有关

第三个大前提，我们在前言中已经提及，就是：结构模式应该同人类短时记忆机制的特点有明确的密切关系。如何具体说明这种关系，正是本文的目的。

要研究这种关系，首先要知道人类短时记忆究竟有什么特点。心理学告诉我们，人类短时记忆一个最重要的特点是：对于彼此间没有明确关系的、相对独立的单位，它所能容纳的最大数目是七个左右（加二或减二）即我们只能暂时地同时记住七个左右的单位（J. A. 米勒，1956（1），1956（2）），这种单位通常可称作“板块”（block或chunk）。

证明这一点的现象和实验多种多样，有一些十分有趣。例如一个象棋大师，他对一个布局看上十秒钟后，就能把其中所有的棋子及其位置记住。但是如果把布局打乱，将棋子没有规律地乱放，则他看十秒钟后至多能记住七个棋子。原因是前一种情况下，他把整个布局当作一个整体记，而在后一种情况下，他只能把各个棋子当作相对独立的离散单位去孤立地记。

现在我们要问，“七个左右”，这个数目对于语言结构到底有什么影响。上一节中我们说过每种模式应该是个有限多项式，那么这个多项式的限度到底是多少？定量化是科学进步的重要标志。那么，我们能否给语言结构模式的项目数定出一个最大的极限数呢？显然，为了求出这个极限数，我们首先应想到利用“七”作为一个重要的参考系数。我们的研究证明，七个左右，是我们实际上大量使用的模式的项目数。例如，由一个动词、加上所谓主语、直接宾语、间接宾语、时间状语、处所状语、方式状语之类的成分各一个，共七项成分组成的结构模式就是。

划分流程和有限切分

3.1直接成分切分法

根据我们2.1节中谈到的对结构的理解，可以认为，结构分析的第一步应该是切分。只有先把一个整体切分成若干部分，然后才谈得上分析这若干部分之间的关系。而且这种切分应该是明确地为结构模式所规定的，即对于某个语段来说，到底应该切分成几部分，以及每一部分的起讫点，都应该是明确的。其次，根据前提2，切分的结果应该是个有限多项式。这两个要求似乎都是很基本的，然而语言学史的事实告诉我们，由于人类语言结构的巨大复杂性，这两个问题的解决并不容易。

先谈谈切分的明确性。（1）“五百米之｜外有花｜蜜”固然是明显错误的，但切分成（2）“五百米之外｜有｜花蜜”或（3）“五百米之外｜有花蜜”，甚至（4）“五｜百｜米｜之｜外｜有｜花｜蜜”似乎都是允许的。比较（1）（4），可以看出，“之外”和“花蜜”的内部并非绝对不能切分，（1）的错误是先切出了“花｜蜜”内部较小的间隔而反而放弃了“有｜花蜜”内部较大的那个间隔的切分。可见切分应该是个有先后的程序过程。在本世纪四十年代，结构主义的描写语言学发展起了一种堪称语言学上重大发明的“直接成分（immediate constituent，简称IC）切分法”，又称层次分析法（R. 威尔斯，1947）。这种方法第一次使语段切分获得了明确的程序，并且清晰地反映了语段结构的层次性。它的基本设想是：若干语素组成一个较大的语段，并不是一下子组合的，而是由小到大逐渐组合的；反过来说，对一个较大的语段进行切分，也不应该一下子切成零零碎碎的许多部分，而应该由大到小地逐渐切分。如：

上述（1）“五百米之｜外有花｜蜜”显然不符合这四层中的任何一层，所以是错误的。可以看出，IC切分法的一个特点是尽量作两分，因此在我国也有人干脆称它为“两分法”。这叫法虽然可以反映出它那“要求每次切分尽可能简单”的原则，但并不完全确切，因为事实上它也有不得不作多分的情况。IC切分法有一整套切分的技术，这里不多谈了。

这四层切分形式代表了四种切分结果，它们排除了另外（2⁷- 1）- 4=123种切分结果。但是，允许的四种切分结果中哪一种最正确呢？或者说，分析结构关系时究竟以哪一层的切分结果为基础呢？如果采取最后一层的切分结果，即切分到无可再分为止，把所有单个的语素都分析出来为止，那么，由于理论上我们可以造出无限长的句子（见下面3.4节），这种切分将是无限的。如果说切分到适可而止为止，那么这适可而止的标准又是什么，仍有极大的主观任意性。上述句子可以有四种选择，稍微复杂些的句子就可以有十来种选择，这怎么办呢？

于是我们提出一种“流程切分”的方法，其特征表现为“向心切分”。为了说明这种方法，我们先介绍一下语言学中的“向心结构”和并列结构。

3.2向心结构和并列结构

如果两个单位A、B相结合，得到一个功能上等于A或B的新单位，那么我们说A或B是组合中的核心，即AB=A则A为核心，AB=B则B为核心。如“身体健康”中的核心是“健康”、因为在许多组合中，“健康”往往可以作为“身体健康”的替代形式，试比较“他身体健康”和“他健康”，“（飞行员）应该身体健康”和“应该健康”。或者说，“身体健康”中可省略的部分往往是“身体”。在“健康的身体”中，则很明显“身体”是核心。核心和非核心结合组成“向心结构”。

如果AB=A=B，那么可以说A和B都是核心，但核心应是相对非核心成分——附加语而言的，都是核心实际上也就是无核心，因此我们把这种结构称为“并列结构”。如“动物、植物动物”=“植物”（就功能上都是名词性的这一点而言）。

有许多理由使我们把语言学中的所有结构都归入向心结构和并列结构两大类。凡是各组成部分地位平等，互相平衡的结构都是并列结构，而各组成部分地位不一样，互相不平衡的结构，其中必有一部分是较重要的，可看作结构核心，整个结构就可看作向心结构。

3.3流程切分法

IC切分法的原则是一层层切分下去，每一层中所有可分之处都要分，而并不区分这些切分的性质如何。流程切分则主张根据切分的不同性质划分不同的流程。

如“身体健康、思想敏捷”，第—层切分得到两部分后，每一部分内部的切分是向心结构的切分，同整体的第一层并列切分已不“同质”，因此应该算另外的切分流程。这样，第一流程切分只得到两个成分，这就是这个语段的基本结构。

两分以后，最后得到七个成分，这就是整个语段的基本结构。这种切分程序就叫“向心切分”，它的原则是，切分逐渐地向着核心靠近，每深入一层，都把上一层中附加语的内部切分排除了。这也就是能够最快地切出核心的切分程序。

向心结构向着一个核心定向深入的“逐次两分”组成一个“流程”，并列结构的“一次多分”也自成一个“流程”，这种根据流程划分阶段的切分法就是“流程切分法”。要注意对于向心结构来说，一个流程只能有一个核心，也就是说一次分析只能在以一个原点决定的坐标系内进行。如上面那个句子中的“这¹三本²想望已久的3书”本身也是个向心结构，可以作向心切分，但由于它有着自己的核心“书”，这个局部核心不同于全局核心“找到”，因此这种局部切分应看作另一个流程，应在整个语段的全局切分后单独拿出去，另外切分。同样，“昨天下午”“他们几个人”等的内部切分，也应该单独拿出去进行。排除同全局结构分析无关的局部结构分析，这就是流程分析法的重要特点。

核心即初始出发点，比较基准，或者说坐标系的原点。一个流程的分析只能有一个原点，其道理是明显的。比如要分析家庭结构，就要判断每个成员的身份，即结构地位，可每个人对于不同的成员就有不同的身份，如同一个人在家中可兼任父亲、儿子、丈夫、哥哥这四重身份。因此，就必须先确定一个家庭核心，比方说“户主”，那么其余成员的身份都相对户主而言，所有成员的身份就被唯一地规定了，并且各成员之间的关系也可通过各自同户主的关系推导出来。核心一多，分析就要乱了套。

句子成分的分析也是这样。

如

“一本”在不同的流程中有不同的结构身份。在第一个流程中，是核心“知道”的宾语（的一部分）。在第二个流程中，是核心“借了”的宾语（的一部分）。在第三个流程中，则是核心“书”的一个定语。同样，“他”可以分别是宾语一部分或主语。更复杂的句子中，一个词可以有七、八种身份。显然，只有把不同的流程分开来，才能确保每一次分析中每一部分有确定的结构地位。

科学的一个基本方法是推导。每一步推导都要有一个相对静止的稳定点作出发点。当我们描写地球的运行时必须暂时假定太阳是相对静止的，可作为观察者的立足点。当描写月亮运动时，又必须以地球为相对静止点。

3.4流程切分的有限性

心理学中做过许多关于“词表”的记忆实验。这些实验告诉我们，对于任意排列的词，我们一次只能记住七个左右。这种词的任意排列，可看作并列关系的结构。因此，在自然语言中，组成一个并列结构的元素项目总不会超过七个左右。以下我们谈向心结构中元素的有限性。

假如说结构项目可以是无限的，那么整个语段结构也就可以是无限长的。的确，语言的无限性一度被认为是语言的最重要性质之一。不过，如不相对一定的有限性而言，我们对无限性的认识就会是非常片面的。上一世纪最著名的文化人类学家的语言学家洪堡特（Wilhelm von Humbolt）就说过语言是“有限手段的无限运用”。

当代语言学家、转换生成语法的创始人乔姆斯基（Noam Chomsky）把洪堡特的这一观点具体化为“有限转换规则的无限递归使用”。例如，由于把“在名词上添加定语”这条转写规则递归地使用下去，我们就可以把下面的句子加以无限的延长、扩展，（1）：This is the cat that chased the rat that ate the malt that lay in the house that was built by Jack……（乔姆斯基，1957）

不难看出，在这无限扩展的过程中，扩展的“生长点”，即每次添加附加语的核心在不断转移。“that chased the rat”是加在“the cat”上的，而“that ate the malt”又是添加在“the rat”上的。这是一种“定语中带定语”的无限扩展。

另一种是“宾语中带宾语”的无限扩展，如（2）“他看到报上说这篇评论认为……”。这种理论上可以无限扩展的句子中，显然每次添加的宾语都是相对上一次所加宾语中的动词而言的，生长点核心也在不断转移。

如果说核心不断转移是无限扩展的必要条件，那么，很明显，核心不转移的扩展必然是非常有限的，并且反过来，向着一个固定核心深入下去的“向心切分”也必然是有限的，即这样的切分所得到的项目必然是有限的。例如，句（1）中的全局核心是is，所以以is为核心的流程只能把全句切成三部分：That¹is² the cat that……。也就是说，整个句子的基本结构由这三部分组成，而后面不管扩展得多么长，都不过是宾语部分的内部扩展或局部扩展而已。同样，句（2）的基本结构由“他¹看到²报上说……”三部分组成。

至于向心结构中元素项目的限度到底是多少，我们另有专文加以论证，本文就不多谈了。这里只需指出，对各种语言中大量句子的分析结果表明，大量句子是由五、六个基本成分组成的，成分最多的句子也不会超过十个左右。

3.5流程、板块和语言编码的心理过程

以上数字正好同人类短时记忆的限度——七块左右（加二或减二）相一致。这说明由流程切分所得到的有限多项式结构模式，既反映了人脑记忆机制对语言结构的限制，（不超过十块），又反映了人类语言结构对人脑记忆潜力的充分利用（大量句子由五、六块组成）。因此我们也就以心理学上的“板块”直接称呼流程切分所得到的项目。

由此我们可以看到划分流程对于控制切分的重要性。而IC切分的根本缺陷是混淆了不同流程的切分。它把处于不同流程的全局基本结构的切分和局部从属结构的切分不分主次地堆放在一起，必然以局部结构的细线条模糊和掩盖了全局结构的粗线条，使人们看不清一个句子或语段的基本格局。我们认为“流程”如同“层次性”一样，也是语言结构的本质属性之一。不分流程的层次分析，完全是一种静态的分析。而流程更强调分析的过程，是一种动态的概念，引进了“流程”的概念后，对于解释许多语言现象，特别是日常交际中边想边讲、边听边理解的“同步（immediate或ongoing）”处理过程，是十分有利的。

人理解言语的过程就是不断“组块（chunking）”的过程。某种语言的一个句子，在一个不懂这种语言的人听来，只是一连串没有内在联系的杂乱的声音，而懂得这种语言的人，却可以从这些声音中听出一个个词，或者说把若干声音组成一个词，并再进一步把若干词组成一个短语，把若干短语和词组成一个句子。这就是不断组成越来越大的板块的过程。这个过程又可以看作是信息编码和译码的过程。好比电报员能从一连串“滴”“搭”声中听出一个个阿拉伯数字，并再把这些数字组成字母或汉字一样。

但是，至今为止，“无论是语言学，还是心理学，都没有十分精确的客观方法，以便分出言语信息编码或译码的组成成分，以及深入研究这个复杂过程中的每一环节的作用。”（鲁利亚，1975，P45）其中一个至关重要的难题就是：组成每一板块的直接下位板块，究竟该如何确定。例如，句子由什么组成的？这问题显然太笼统，因为回答是短语、词、语素、音节、音位都可以，就像我们说组成人体的可以是系统、器官、组织、细胞乃至分子、原子等。所以明确的提问应该是：直接组成句子的成分是什么？

直接组成句子的显然不是音位和音节，它们根本不是语法平面的单位，如果说是语素和词，那么一个句子的直接组成部分将可能几十个乃至上百个，这就远远地超出了人类短时记忆的限度——七块左右。如果说是短语（即词组），那么问题是短语，这个概念太不明确，可大可小。语言结构的一个特点是层层相套。大短语里可套小短语，如“看无聊书的人”，整个地是个定名短语，但作为其中一部分的“看无聊书”本身也是个动宾短语，其中“无聊书”本身又是个定名短语。直接组成句子的短语到底又以那一层的短语为准呢？说到底，句子本身不也是一个独立的，带上一定句调的短语吗；如果说直接组成句子的是主语、谓语两部分，那么，这种两项式的结构显然离开七左右太远，也就是说，这种结构远远地没有充分利用人类短时记忆机制的潜力。当然，任何句子都是主谓两分的说法还会引起一系列语法分析的矛盾，这里就不必谈了。

看来，局限于已有的那些关于语言单位的概念，这个问题是无法回答的。极而言之，一个语段的直接组成部分可以是任何有形有音的实体，如：（他）说“……”。引号里的宾语部位可以填进一个词、一个词组，乃至一个句子、一个复句，也可以是一个无意义的音节、音位。又如：“……”代表什么什么。引号里的主语部位可填进一个根本没有声音和一定意义的“⊕”，也就是说，连非语言单位的视觉符号也可以充当一个语段中的直接组成部分。这样，我们就不得不引进由切分流程所决定的“板块”概念、用来指所有这一切大小不等，但在具体结构环境中，特别是相对全局核心而言，起一个整体作用的单位。构成一个语段（包括句子）的直接下位单位就是板块。

板块是一种相对刚性体，这表现在它在语序调动中是作为一个整体单位出现的。

—个非常简单的句子，假如有17个语素，如“昨天¹他们两个²找到了³那本想望已久的书”，那么，17个语素可能的排列有P₁₇之多。但其中合乎语法的排列极少。多方面的因素限制了排列的可能性。第一步的限制就是：在这个语段的具体环境下，有一些语素必须放在一起而不能分开，这样，我们就可以把它们当作一个复合单位——板块处理，上述句子中，这样的板块有四个，我们分别以“TSVO”表示，这四个板块可以成块地互相交换位置，产生种种变式。并且，不同语言间进行翻译时，也是以这样的板块为基本对等单位的。当然，“那本¹想望已久的²书”，内部又分三个小块，可以调动位置，如变为“想望已久的¹那本²书”，但这是另一个流程的分析，是大板块内部的小板块的调动，这种小板块的调动不能超出上位大板块的边界，因此不影响上位大板块的整体性。

大板块、小板块、更小的板块，可以层层相套。在这无限的循环过程中，面对这种乍一看乱蛛网般纷繁的结构关系总和，我们要进行有条不紊地分析，就必须用核心去控制流程：一个核心带一个流程（对向心结构而言），由大到小地，一个个流程分析下去。

余论

直接组成一个流程的板块不能超过七块左右，这一限制贯穿语言结构的各个平面：一个音节不能超过七个音位，一个语素不能超过七个音节。

我们认为“板块”是一种新的度量单位，即计算“结构长度”（不是“线性长度”）或“结构复杂度”的基本量。以它为标准，可以明显地反映出人类自然语言中句子的结构长度是有限的，并且各种发达语言的结构长度的限度也是一致的。建立基本量是定量化的前提，例如，“比特”的确立终于使计算信息量成为可能。概念的价值在于广泛使用。如何运用“板块”揭示和描写人类语言的更多规律，是我们目前正在努力进行的一项工作。

参考文献

Greenberg，J. 1963，《Univers of Language》，Cambridge，Mass，M. I. T. Press

Miller，J. A. 1956，（1）The magical number seven，plus or minus two，《The Psychological Review》No：63

1956，（2）Human memory and the storage of information，I. R. E. Transaction on information theory. vol：IT-2，No. 3

Wells，Rulon. 1947，Immediate constituent，《Language》Vol. 23

Chomsky，Noam. 1957，Syntactic Structure，the Hague：Mouton.

Лурия, А. Р. 1976, Основы? проблемы нейролингвистики