扩散机理——一种巧妙的变形观点

一张地图所能展示的不仅是河流、公路和国界,它还可以表达一种看法。索尔 · 斯坦博格(Saul Steinberg)通过《纽约人》(New Yorker)展示的一幅纽约市区及边界的透视图,阐明了一种叫做“从第九街看去”观点。除了城市的大街和哈得逊河,地图一直向西延伸,边界模糊,其中包括新泽西州,美国的其他部分,以及太平洋和隐约可见的亚洲和欧洲。这幅地图巧妙地将曼哈顿人的自我中心论暗含于世界中。

一张地图还可以阐释人们的生活方式。它可以使一些抽象的事物具体化,比如人口调查的结果,疾病的发生率,或者是电话的使用情况。用一个简单的颜色代码,就可以表示出某种特定疾病在不同地区发病率的高低。

图1:癌症的扩散。在纽约市男性肺癌病例地图中,每一点代表十个病例,这些点随机地出现在邮政编码区中。填平了人口密度的因素之后,原来的州地图(左图)就发生了严重的变形(右图),这样就很容易找到肺癌的高发地区。

然而,这样的描述可能会使人误解。不可避免地的是,城市的发病率比乡村高,但这仅仅是因为城市有较多的人口所致。根据疾病发生数的制图方法对解决这个问题有一定的作用,但易丢失疾病高发区的信息。

解决这个问题的一个办法就是排除人口密度变化的因素,但仍可显示各地的发病人数,这只有在一张经过变形的地图上才能做到这一点。在这张地图上,各地地理区域的大小与它们的人口数成正比,而与其他因素无关。

制作一张变形图极富有挑战性。有时,在绘制地图上的重叠部分和有特殊弯曲部分时,使用计算机程序会很容易完成。但是在有些案例中,所需绘制的地图太过歪斜以致阅读和翻译他们时困难重重,绘制一张这样的地图常常会花掉计算机好几个小时的时间。

现在,有两位研究人员已经将精力转向以物理学上的扩散原理为基础,发明了一种新的、快速的方法通过计算机来绘制这种地图。“我们的方法在概念上很简单。我们力求绘制出实用、美观、可读性高的地图。”密歇根大学的马克 · 纽曼(Mark E. J. Newman)和迈克尔 · 盖斯特那(Michael T. Gastner)说。他们的这项成果发表在2004年5月18号的美国科学院院刊(PNAS)上。

“我们现在需要一种切实可行的方法来解燃眉之急,”英国谢菲尔德大学的地理学家丹尼尔 · 多林(Daniel Dorling)说,纽曼和盖斯特那所提出的算法“一定会被证明是对全世界制图学有巨大价值的方法”。

完美的变形

美国大陆的地理图由许多不同面积和形状的州拼接而成。在这张重新绘制的地图上,每个州都是按照人口比例绘制的,人口稠密的州被放大了,人口稀疏的州就被缩小了。在这样一张地图上,面积相对较小而人口密集的新泽西州变大了,而面积广阔的怀俄明州就变小了。

从数学方面来讲,确实有很多方法可以完成这样一个转变,甚至可以同时肯定这幅地图的总面积和基本的连续性都不被改变。换句话说,可以保证地质学上的完整性。在误差允许的范围内,地理学家和其他的研究人员已经提出了许多不同的思路和办法。多林自己也发明了许多设计精巧的办法来作图,但是每一种方法都存在美中不足之处。

一张完美的变形图,应该是把地理上的变形降低到最小的程度。“如果你立足于在一块很小的范围内看这张地图的细节,它与正常的地图会非常地相似。”多林说。比如犹他州、科罗拉多州、新墨西哥和亚里桑那州,在某一个特殊角度上与标准的美国地图完全一致。这些州也就近似于变形图。

在绘制地图的过程中,要达到这种完美的程度很困难,所以研究者们分秒必争,集中精力绘制出尽可能完美的变形图。

开始时,纽曼和盖斯特那观察到这样一种现象,在一张以人口数为绘制依据的变形图上,人口被平均分配。这一现象给了他们提示,从地理图转化成变形图的过程中是否可以将物理学上有关扩散的原理——即气体散开后充满一个可到达的空间,直到这个空间的气体密度处处相同的过程。

应用到一张地图上,就是人口从高密度地区向低密度地区流动,这种流动打破了地区之间原有的边界,从而产生了一张新的地图。

从这样的分析中得到灵感,纽曼和盖斯特那转向物理学家用来描述扩散的方程式。为了对一张已知地图用数学的方法进行人口密度的描述,他们用计算机解决这个扩散的方程式。结果获得了一张人口密度处处相等、并且没有重叠区域的地图。

“这项工作所需的程序是非常复杂的,所以制作第一张地图确实花了一番工夫”,纽曼说,“一旦我们尝试过后,很快就发现这是一个非常有用的工具。”

令人惊奇的是以前从没有人想到过用这种方法。纽曼说,“也许对于一个物理学家来说,这是一个合情合理的问题——扩散的问题对一个物理家来说在大学阶段就已知晓,但对于从事这个课题的人来说却不那么简单了,因为这些人都是地理学家或者是制图者。”

“纽曼和盖斯特那的方法真是太棒了,”加利福尼亚大学圣巴巴拉分校的地理学家沃尔多 · 托伯勒(Waldo Tobler)也同意他们的看法,“但是数学上的困难实在是太大了。”

19世纪60年代后期,当时正在密歇根大学供职的托伯勒第一个提出用计算机制作变形图。在他最初的方案中,原始的地图被分割成长方形或六边形的单元,每个单元可以按照人口数的多少独立地被扩大和缩小。重新制作过的单元都变了形,这样他们彼此的边缘就可以重新匹配。这项工作被重复了一次又一次,直到这些单元中人口密度被完全抹平。

图2:研究人员从1994至1998年间的72000条电报新闻的日期栏中做了摘录,并且将一幅标准的美国地图(左图)变成了一幅变形图(右图),在下图中,各州的相对大小完全取决于他们在日期栏中出现的频率。

这是非常重要的第一步,但是托伯勒的方法太慢了,而且有时会产生不适宜的变形。

其他一些研究者曾经试着改进托伯勒的工作。多林最近设计的一个方案也把地图分成了许多单元,经过程序的每一步努力,靠近边界的单元都根据人口的需求被重新改变了形状。人口稠密地区的面积增大是以人口稀疏地区面积的减小为代价的。另一个方法是允许单元的边界发生移动,它既反映了空间的需求,也反映了单元与单元相互之间所产生的影响。

尽管这项工作已经取得了一些进展,但是仍然没有一种方法可以完全解决这个问题。

歪斜的美国

纽曼和盖斯特那采用他们的扩散方法对美国2000年的人口调查数据进行了试验。为了验证这种方法的有效性和通用性,他们绘制了一系列变形图分别表示2000年美国总统大选的结果,纽约州男性肺癌发病率以及各州电报新闻服务的分布情况等。

在共和党人乔治·布什和民主党人戈尔的激烈竞争中,纽曼和盖斯特那按照人口密度绘制的变形图显示出不同的结果。相对而言,根据两个候选人的得票数,用标准的地理图和两种颜色表示州的情况之后,显示出共和党赢得的一种颜色更大——尽管结果是民主党人戈尔最后的得票数略多。

“那么就可以肯定了,一张简单的地图是很难反映出竞选结果的真实性。那就是说,根据那张地图来判断哪个党赢得更多选票是很难的。”纽曼和盖斯特那说。

在每一次应用时,研究者必须选定一种地理区域作为一个基本的单位。比如在美国,他们可以把每个州的人口数据集中起来,然后根据州的面积平均分配,或者一个县接着一个县,一次普查接一次普查地不断做下去。

基本单位的选定通常用于建立一个所谓人口密度函数,它影响到变形图的变形程度。例如,把一个国家的人口平均后绘制成的变形图,会比县与县之间的人口分布图具有更多的可识别特征。

同样,绘制一幅好的变形图也是一种艺术,这在一定程度上取决于人口密度函数的定义对形状改变的决定程度。纽曼和盖斯特那在PNAS发表的文章中说,人口密度函数的选择取决于该方法的使用者,他或她必须决定该方法应选择哪一个最有代表性的特征。

用纽曼-盖斯特那的方法绘制一张地图非常之快。“绘制地图是一件非常复杂的事情,任何一项运算都会花去很长的时间,”纽曼说。“我们的方法计算速度明显加快,往往只需要几秒钟(而不是几小时或者几天)就能完成计算,其实用性与其他方法有着很大的不同。”

物理学家还发现,用纽曼-盖斯特那的方法绘制出的地图不仅美观,而且通俗易懂。“如果你有正确、快速、实用、可读性好的地图,那么你就有了变形图所需要的所有东西。”纽曼说。

如今,纽曼和盖斯特那只将他们的技术用在几个有标准化的例子中。他们计划开发一种软件包,这样就可以为地理学家和绘图者提供很大的方便,让他们把这种方法用于解决更复杂、更有趣的问题中,而不必每次都要编写复杂的程序。

纽曼和盖斯特那正在致力于进一步提高这种方法的速度,他们希望将这种工具应用到全球范围内。

“我们没有试验过比美国更大的地图,但这不是因为绘图的问题,”纽曼说,“事实上,美国地图已经被分成了1000×1000的网格。也就是说,在那张地图上,我们已有100万个区域,即使这样,计算的速度仍然非常快。”

绘制更大范围的世界地图对这个方法提出的挑战就在于地球的曲率。纽曼和盖斯特那所用的平铺面积的方法对美国适用,而并不适用于全球。

面对更大的区域,“我们可能需要重新编写我们的计算机程序”,纽曼说,尽管这样,“随着时代的发展,我可以预言更大的地图,甚至是整个世界地图的绘制将不成问题。”

尽管多林赞赏纽曼和盖斯特那的工作,他也知道绘制一张接近最好的变形图的世界地图需要付出更多的努力,但在理论上是完全可能的。

“绘制一张(完美的)变形图仍然是一个算法上的谜”,多林说,“我花了15年时间找到了一个愿意致力于这方面研究的博士生。我们现在有了计算机的帮助——我们的脑子不够用了。解决的办法也许会在其他的领域中找到。”

“我工作在复杂的学科领域的重复课题中,在那里常有许多非常好的主意摆在那里,而且其中有许多是众所周知的,但是它们并不被每个领域所了解。”

纽曼接着说,“所以,人们如果可以稍微涉猎一点点自己专业以外的知识,甚至是我们平时很少甚至并不关心的非常普及的知识,就可以取得很大的进步。”