卡利安普迪 · 拉奥是数据筛选和设备设计优化的强大工具的先驱。

20.1_副本

卡利安普迪 · 拉达克里希纳 · 拉奥(Calyampudi Radhakrishna Rao)首次创立了强大的统计方法,这些方法为现代科学数据分析奠定了基础。采用“信息几何学”和其他数据简化技术,可以从变量众多的数据集中提取信息,从而更轻松地将其可视化或进行分类。拉奥在20多岁时就发表了多篇开创性论文。2023年8月,拉奥与世长辞,享年102岁。

拉奥认为,统计学领域的发展应由其应用来推动。他创立的统计学理论对农业科学、生物医学研究、计量经济学、工业工程、社会科学和信号处理等领域均产生了巨大影响。例如,科学家利用他的方法,从欧洲粒子物理实验室收集的数据中发现了希格斯玻色子的迹象。

拉奥出生于印度哈达加利。拉奥的父母在其年少时就发现了他的数学能力,并鼓励他在安得拉大学攻读数学学士和硕士学位。

1941年,拉奥进入由著名统计学家马哈拉诺比斯(Mahalanobis)创立和领导的加尔各答印度统计研究所(ISI)。同年,拉奥进入加尔各答大学开始攻读统计学硕士课程,当时统计推断的基本原理仍在建立之中。1943年,拉奥在解答一名学生的问题时,推导出了一个下界(现在称作克拉默--拉奥不等式),用于估算某个统计群体的未知参数,如一种新药可使血压降低的平均幅度。他提出了一种算法(现在称为拉奥--布莱克韦尔定理),以推导出进行此类估计的规则。例如,通过测量小部分随机群体的降压值,可以准确地估算出整个群体的血压。拉奥还在统计学文献中首次使用微分几何来定义两个概率分布之间的不相似度量。他在自己的论文中介绍了这些结果,由此催生了信息几何这一术语。

1946年,拉奥应邀到英国剑桥大学考古和人类学博物馆工作。他分析了从苏丹几千年前的古墓中发掘的头骨的形状,并根据遗骸所属部落和年龄进行了分类。与此同时,他开始攻读博士学位,师从现代统计学奠基人罗纳德 · 费舍尔(Ronald Fisher)。拉奥的工作包括绘制小鼠染色体图谱,以研究遗传间的联系。

1948年,拉奥回到印度统计研究所。次年,就在29岁生日前不久,他被任命为教授。他先后担任研究和培训部门主管,印度统计研究所后来成为世界上最重要的统计机构之一。

许多数据分析工具都源自拉奥的硕士和博士论文以及他在1940年代发表的论文。例如,在他的硕士论文(1943)中,通过分析生活在印度北方邦的人口数据,开发了用于比较两个或多个实验组的“周长”试验,由此催生了用于比较样本平均值的多元方差分析(MANOVA)程序。他在自己的博士论文和随后发表的论文中提出的统计方法为判别和分类理论、多元方差分析等现代数据分析方法奠定了基础。

拉奥的技术还被应用于实验和设备的设计,如计算机芯片,旨在筛选出设计坚固耐用产品的关键参数,同时最大限度地降低成本、减少工时并节约劳动力。后来,这些被称为正交阵列的最优配置被日本工程师田口玄一发扬光大,并成为日本自1970年代以来工业质量革命的基础。

1978 年被强制退休后,拉奥移居美国。他对匹兹堡大学的统计课程产生了影响,并在那里共同建立了多元分析中心。1988年,他搬到宾夕法尼亚州立大学,2010 年搬到纽约布法罗大学。2007 年,拉奥数学、统计学和计算机科学高级研究所在印度海得拉巴成立。

在拉奥的众多著作中,他的《生物学研究中的高级统计方法》(1952)和《线性统计推断及其应用》(1965)具有代表性。全世界几代统计学家都是通过这两本书接受培训的。拉奥一生获奖无数,就在他去世前几个月,他成为第四位国际统计学奖获得者。该奖于 2017 年设立,旨在促进人们了解统计学在当代生活中的作用。拉奥是一位培养学生独立思考能力的优秀教师,我们将深切怀念他。

资料来源 Nature