14. 泛化倾向公理

泛化倾向,是人们从特殊推广到一般的一种倾向。 这种倾向,极大地拓展了抽象世界的丰富性,并使得我们有可能用统一的抽象概念来解释世界。

14.1. 公理的陈述与说明

泛化倾向公理

如果一个对象或事件,或者一些相似的对象或事件,都有某个(参数化的)性质, 我们就倾向于把这个性质泛化到,或者说推广到其他相似的对象或事件上去。

比如我们说有“红苹果”、“红草莓”、“红樱桃”,我们在语言上就有一种倾向, 去把“红”这个词进行泛化,去形容其他的事物。 按照通常的(后验)看法,我们可以把形容词放到任意的名词前面,并把这当作一种排列组合的可能。 但是从认知发生顺序来说,如果我们脱离了对象,就无从认识“红”这个形容词。 一个婴儿在会说“红”这个词之前,大人可能会给他展示很多红色的东西,并和他说“这是红的”, 然后这个婴儿领悟到了这些东西具有的相同性质(比较倾向和相等倾向的结果),并对“红”这个词对应了起来。 所以,更准确的说法是,我们先认识了一些红色的对象(苹果、草莓和樱桃),然后我们抽象出“红”这个概念(严格地说在泛化之前只能形容苹果、草莓和樱桃), 再试图通过“泛化”来扩大“红”这个概念的外延,亦即试图用“红”来形容其他的名词(比如汽车)。

泛化的结果当然可能是不正确的。比如我们可以从“方形的月饼”泛化出“方形的月亮”。 “方形的月亮”当然可以出现在想象的世界中,然而它不存在于经验的世界中。 所以,如果我们的设定是经验世界,那么“方形的月亮”就是一个失败的泛化结果。 但是,泛化倾向本身并不考虑泛化的结果是否正确:那是否定倾向负责的事情。 事实上,与其为了精确性去压抑我们的泛化倾向,我们不如去鼓励更大胆的泛化,同时对其结果用否定倾向和逻辑倾向来进行更严密的评判。

需要注意的是,泛化经常会改变事物的原有属性。 具体来说是用明确表达出的属性来替代隐藏的、未言明的属性。 比如我们把“方形的”这个属性泛化到“月亮”上时,“方形的”这个明确指出的属性,就替代了“圆形的”这个默认的、未明确指出的属性。

一般来说,如果两个对象越相似,我们就越倾向在它们之间进行概念泛化,而且泛化的结果就越可能成功。 比如,一个农夫喜欢吃“甜甘蔗”,他就倾向把“甜”这个概念泛化到其他的食物上。 泛化倾向可能会引导他形成了“甜苹果”的概念,然后他可以通过育种等手段来提升苹果的甜度并降低它的酸度。 然而,他一般不会想到把“甜”这个概念泛化到“盐”、“桌子”、“月亮”这些对象上,因为它们与甘蔗(味道)的区别过于巨大。 可是,泛化倾向并不一定非要在发生在相近对象之间。 比如,“甜”也可以用来形容一个笑容:在这个例子中,“甜”这个本来是形容味道的形容词,就被成功地泛化去形容一个与味道无关的特征。 另一个例子是,温暖作为一个原本形容温度的词,也可以被泛化来形容其他的事物,比如温暖的颜色,温暖的声音,温暖的亲情,等等。 更多的例子请见我们在比较倾向公理中的讨论

我们还要指出,“泛化”和“抽象化”是两种不同的过程。 在“抽象化”那里,我们从一些给定对象中,用比较倾向和相等倾向提炼出了概念。 因此,“抽象化”得出的概念,可以被自动地对应到那些给定对象上去:要应用到其他对象上,就需要首先对这个概念进行泛化。 泛化则不同:泛化是先有一个原型对象和关于它的一个既定概念,然后我们去寻找有可能可以承载这个概念的其他对象,并对它进行必要的调整来创造符合概念的新对象。 因此,泛化是人类想象力的一个重要方面。

14.2. 泛化的类型

泛化倾向的作用领域十分广泛,表现出的形式也多种多样。

1、自然语言中的泛化。

我们首先举几个例子。

  • 偏正短语的泛化。比如以上提到的试图用形容一个名词的形容词,去形容另一个名词:这是定中短语中的泛化。泛化倾向同样可以作用于副词和动词组成的状中短语:比如从“快跑”泛化出“快过来”。

  • 句子的泛化。给定两个结构相同的句子,我们就可以以其中一个为基础,对另一个进行泛化。比如给定两个描述经验世界的句子:“一只白猫走过了马路”和“一只黑狗走进了屋子”。 我们很自然地把第一个句子中的“白“和”过了马路“泛化到第二个句子上,得到:“一只白狗走过了马路”。同样地,我们也可以得到“一只黑猫走进了屋子”。 然而,后两个句子并不从现实中来:它们是我们使用概念产生的一种构想,虽然它是一种对经验世界中可能性的构想。 严格地说,在我们真的观察到它们在经验世界中的对应事件之前,它们都只是概念上的存在。

我们在组词造句时,一般使用的都是我们的泛化倾向,而很少是语言要素之间的自由组合。 否则,我们想出的大部分词组和句子都将是无意义的:比如“橙子吃白云”、“红色大于月亮”。 当然,只要我们想,我们也可以尝试在一个有限范围内去穷尽所有的排列组合:这时候意识代替了负责比较倾向的意识下属部门来作比较。 与使用语言要素进行自由组合不同,我们在使用泛化倾向组词造句时,想到的语言素材是由(涉及记忆的)比较倾向提供的:在语境涉及的那一方面越相似的对象被想到的概率就越高。 当然,这不一定总会成功。 我们可能想出(泛化出)一个句子,然后感觉它是荒谬的。 然而我们之后还是会有类似的经验:通过学习我们可以去优化一些泛化中的细节以使它更有效,但却绝不是去“改正”这种思维方式本身。 所以,人的意识并不怕犯错,事实上越高级的知识就越经常需要人们进行很多次的尝试才会最终获得。

2、概念的泛化。

在概念的泛化中,我们把原本只适用于某些特定对象的概念,推广到更广泛的范围中去。

  • 比如“所有的物体都有重量”就是一个泛化的结果:我们在有限次对地球上不同物体的测量中,每次都得到了重量,因此我们就把“重量”这个概念泛化到了所有的物体中去。 当然这里的测量样本不够全面:因为如果我们没有在外太空的测量,我们把这个命题泛化到外太空中的情况去就很可能是有问题的:这就会引发否定倾向的范围否定。

  • 对重量泛化的失败,指引我们去“调整”重量这个概念,让它不仅适用于地球上,也适合外太空或其他任何地方。 这样,物理学家就“泛化”出了“质量”这个概念:如果我们仅限在地球表面使用,质量与重量只差一个比例常数,因此在理论上来说可以仅选取其中的一个来构建理论(比如使用千克力作为重量单位); 但是如果我们要研究普遍的物理规律,我们就必须使用质量这个普适的概念来替换重量这个与此物体附近的大星体直接相关的概念。 牛顿大概第一个想到“天上的物体与地上的物体遵循相同的规律”:这显然是泛化倾向的结果。

  • 比如“能量”这个概念,是几代科学家对各种形式能量的最初认识,比“活力”(动能)和“热质”(热能)等,进行泛化而最终得到的统一结果。

  • 比如把操作具体数字的算术,泛化成操作代表数字的抽象符号的代数。

  • 比如把加法和数乘从自然数泛化到整数、到有理数、到实数、到复数、到四元数、到向量、到矩阵、到张量、等等。

  • 减法的泛化与负数。在我们只有正整数时,要求被减数大于减数是完全逻辑的。 然而,至少在某些人那里,泛化倾向是如此的强烈:他们试图要扩充数的范围和运算的规则以使得“减法可以发生在任意的被减数和减数之间”。 他们的研究结果,就把“正整数”扩充到了“整数”。

  • 同样的,人们用泛化倾向把“整数”扩充到了“有理数”(除法可以发生在任何一个被除数和任何一个非零除数之间), 把“有理数”就扩充到了“实数”(任何柯西列都收敛),从“实数”扩充到了“复数”(任何数都有平方根),等等。

  • 比如把一个定义域比较小的函数,“泛化”成一个定义域比较大的、满足一定关系的函数(比如在小的定义域里两个函数相等,比如保持解析的性质,比如保持范数不变)。这一过程一般被称为“延拓”。 对算子做同样的事情,则被称为“算子的扩张”。 下面我们举个简单的例子来说明这种操作。假设\(x\)是一束单色光,\(c\)是可见光的频率函数,对应一种测量可见光频率的方法,那么\(c(x)\)就是单色光束\(x\)的频率。 后来我们知道了光是一种电磁波,也发明了更高级的测量方法。 那样我们用\(x\)来代表电磁波,\(C\)来代表频率函数,对应于一种既可以测量可见光频率,又可以测量其他范围电磁波频率的方法。 那样,如果我们忽略测量误差,当\(x\)是可见光时,我们有\(c(x)=C(x)\),当\(x\)不是可见光时,\(c(x)\)不再有意义(测量不出颜色),而\(C(x)\)仍然是频率,仍然代表相同的物理意义,只是这种频率不再对应一种光的“颜色”。 这样,函数\(C\)就是函数\(c\)的一个延拓。

3、有关判断或事件的泛化。

我们将在下一节中详细讨论这种情况。

14.3. 子公理:类比与类推倾向公理

当泛化倾向作用于事件或判断上时,我们把其中的两种特殊情况称之为类比倾向和类推倾向。

类比与类推倾向公理

  • 类比倾向是指,人们倾向于认为两个在很多方面都相似(相等)的事件或判断,在其他方面,或者更严格地说,对事件或判断本身有影响的方面,也相似(相等)。

  • 类推倾向是指,我们把事件或判断的一个性质泛化到一系列与之类似的事件或判断上。

在描述一个成熟的系统时,我们较少使用类比和类推,因为它一般来说,不能产生精确的知识。 然而,在获得灵感时,类比和类推作为很具启发性的思维方法,却是非常重要的来源。 比如,一个方法用解决A问题时有效,我们就会试试这个方法是否在解决一个与其相似的B问题时有效。 不管是在日常生活还是科学研究中,这种思维都是有益的,虽然在科学知识的具体表述中,经常会用其他更严格的方法来掩盖这个原始的动机。

当两个事件或判断越相似时,类比就越可能给出有意义的结果。 在如下两种情况下,类比可以得出(大致)精确的知识。

1、全同类比:如果在两个事件里,我们确认除了一个对结果有影响的要素(可以是结果本身)之外,所有其他对结果有影响的要素都相同,那我们则判定在两个事件里,这个要素也相同。

这是因为,如果不是这样,我们就可以认定这个要素的不同对结果就没有影响,与我们题设的“它对结果有影响”相矛盾。 当然,从最精确的角度来说,函数\(f(x,y,z)\)满足\(f(x_1,y_1,z_1)=f(x_2,y_1,z_1)\)并不足以说明变量\(x\)对函数值没有影响。函数在越多的\(x\)值上相等,我们则越相信变量\(x\)对函数值没有影响:这是否定倾向的评判功能的体现。同样,如果变量\(x\)对函数值有影响,\(f(x_1,y_1,z_1)=f(x_2,y_1,z_1)\)也不足以说明\(x_1=x_2\),比如函数在\(x\)方向上有周期性,或者一般地来说方程\(f(x,y_1,z_1)=f(x_1,y_1,z_1)\)的解不唯一。

在运用这种方法时,我们一定要确认:

  • 我们通过类比方法得出相等的那个要素,必须要对事件的结果有影响。比如我们不能说因为使用两台计算机进行同一个仿真时,仿真的各个方面都完全相同,那么这两台计算机就有相同的颜色,或者相同的序列号,因为颜色和序列号一般与仿真过程无关。

  • 我们需要确定所有其他对结果有影响的要素都相同。 比如我们不能说,“因为乌龟和白兔都开始跑,又都达到了终点,所以它们跑步所需的时间就相等”。 这是因为这个类比中没有考虑速度这个关键要素,所以它不是全同类比,也可能得到错误的结论。 同样,我们也不能说,在两个事件中,单摆的起始和终止状态都完全相同,所以两个事件经过的时间是一样的,因为它们不一定经历了相同多的周期。然而,单摆经过一个周期和经过两个周期,并不是除了经过时间之外的其他因素都相同,因为它们的运动轨迹显然不同(一个运动了一个周期而另一个运动了两个周期)。因此,虽然我们经常选择几个有代表性的要素来检验,但全同类比的有效性依赖于所有其他要素的相同。

全同类比通过类比得到相等,是一种非常广泛、有效而精确的思维方法。

全同类比的一个例子是:两个一模一样的物理过程经历的时间相等。 古人在不知道牛顿力学的情况下,在这个原理的启发下,发明了各种计时工具,比如沙漏和香钟。

2、穷举法

类推要想达到精确性,就必须满足以下条件:

  • 我们明确知道“类推”所作用的类中的所有成员;

  • 我们知道类推的那个结论对类中的所有成员都有效。

只是,在这种情况下,我们一般不称之为类推,而称之为穷举了。 穷举不仅仅是类推:事实上,穷举是类推倾向和否定倾向共同作用得到的结果。 类推倾向试图扩充我们的“知识”(某种意义下的),而否定倾向则负责去验证类推的结论是否对每个成员都成立。 如果都成立,那样否定倾向公理即无可否定:它无法否定结论对任何成员的有效性(因为已经被否定倾向验证过),也无法进行范围否定(因为所有的可能都已经给出)。 无可否定即意味着精确性,或者更严格地来说,“我们当下无法对一个命题作出任何否定”即意味着“当下的我们承认这个命题是精确的”。

当然,穷举法作为证明方法不是很符合逻辑倾向的评判功能,即这种证明缺乏美感,因为对每一种情形进行分别验证,使得各情形之间彼此割裂,从总体上来看逻辑联系不够丰富,好像理性在证明不同情况的时候讲着不同的方言一样。 然而对于一些定理,我们尚未发现穷举法之外的证明方法,比如四色定理(目前尚需要计算机辅助)。

14.4. 泛化倾向公理的证明

第一个证明:普适概念的存在

如果人类没有类推倾向,则类似质量、能量之类的普适概念就不可能存在。 这是因为,人类测量过、研究过的对象只是所有对象中的极小一部分:因此如果人们只使用抽象化而不使用泛化,人类就无法得到任何普适概念。

第二个证明:自然语言中的组词和造句

组词和造句之所以可以进行,从根本上来说是泛化倾向作用的结果。 如果人们没有泛化倾向,亦即如果人们坚持只描述他们见过的对象和事件,坚持抽象概念只能运用于在抽象化过程中涉及的具体对象和事件,那么组词和造句就是不可能的。

第三个证明:数集的扩充

从整数到有理数、到实数、到复数的数集扩充,其动机都是使得某种运算可以一般化:即任何整数都可以被任何非0整数除,任何非负有理数都可以求平方根,任何实数都可以求平方根。 这个扩充过程绝非易事,甚至完美的解决(涉及其他方面的泛化要求)在事实上还引入了与动机貌似不相关的新的存在,比如超越数,虽然人们最初解决这些问题时并不一定发现了这些新的存在。 虽然困难,但是一代又一代的数学家都经常往这个“泛化”的方向努力。 这不仅证明了泛化倾向的存在,而且证明了泛化倾向至少在某些人那里,是非常强的。

14.5. 泛化倾向公理的评判功能

最后我们讨论一下泛化倾向公理的评判功能。 泛化倾向公理当然也有评判功能:它倾向于偏好可以被泛化的概念。 然而,这种偏好只是暂时性的,因为在进行完成了所有可能的泛化之后,这个概念就不再可以被泛化了。 但这种不再可以被泛化的概念却是更符合我们理想的概念,虽然这个概念不符合泛化倾向公理的评判功能。 出现这种情况的原因是,否定倾向功能的评判功能远强于泛化倾向公理的评判功能。 泛化倾向公理主要的作用是产生新概念,而不是评判新概念:它只是偏好它可以有用武之地的情况。

14.6. 与其他公理的关系

  • “泛化”的原始材料——即原型对象或原型事件及其某种性质——是由对象化倾向、比较倾向和相等倾向共同作用而得来的。 对此,详见“抽象化”。

  • “泛化”作用的对象由比较倾向提供。具体来说,在我们把对象\(A\)的性质推广到\(B\)\(C\)\(D\)……上去时,\(B\)\(C\)\(D\)……这些对象是由比较倾向公理提供的; 相反,在我们需要赋予\(B\)\(C\)\(D\)……某种新性质时,比较倾向找到了\(A\),然后泛化倾向才可能把\(A\)的性质泛化到\(B\)\(C\)\(D\)上去。

  • 泛化倾向和切分与组合倾向经常共同作用来进行思维的建构。 比如在我们把苹果的性质“泛化”到梨子上去时,如果只用泛化倾向,我们只能从“红的苹果”和“甜的苹果”,得出“红的梨子”和“甜的梨子”。 如果我们继续使用组合倾向,我们就可以得出“红而且甜的梨子”。

  • 泛化倾向的结果合理与否,需要否定倾向和逻辑倾向来评判。 如果完全不合理,我们就会抛弃它;如果完全合理,我们就会采用它; 如果不完全合理但有可取之处,我们就会使用调整倾向、否定倾向和逻辑倾向来改进它。 泛化倾向扩充了逻辑倾向可以思考的对象。