投稿问答最小化  关闭

万维书刊APP下载

神仙打架的统计学发展史

2023/7/24 15:44:19  阅读:31 发布者:

作者:anova

来源:计量与统计

你好奇这统计学理论打哪开始诞生的不?你好奇为啥有了高冷的“数学”还需要“统计学”这家伙来凑热闹不?你好奇回归分析到底回归了什么不?

别急,今天咱们就来聊聊统计学开天辟地时那些神仙打架的故事——

话说long long ago,那时宇宙还是一片混沌。角落里那个沉睡了一万八千年的男子,缓缓睁开了双眼,可是这眼睁开了就和没睁开一样,黑麻麻的一片啥都看不见。他抄起不知道什么时候出现在自己手中的斧子,划拉了一下——天地就那么诞生了。

时间的巨轮已开启,在世间改朝换代的同时,文明的更替让学术界也发生了翻天覆地的变化。公元前五世纪,那时候冷面“数学”还是幼齿小孩,而我们的“统计学”,直到两千三百多年前才由百科专家亚里士多德牵着手介绍给众人。

我们这位“统计学”小朋友一路的成长经历颇为丰富,小小年纪就周游了欧洲列国,就连他的名字也是由最早的拉丁语statisticum collegium(国会)演变为意大利语statista,随后又改为德语statistik。还没完,这小子估计去了次法国,又一次更名为statistique,顺道逛了一圈丹麦,起了个statistiek昵称,直到最后终于安定下来了,称为Statistics

从无到有,任何一门学科在其发展的道路上都会有派别的划分和争斗,统计学也未能幸免,比如我们将会看到的如下激烈的门派争夺战——

Round 1

决战时间:17世纪

双方战队:政治算术学派Vs国势学派

主力队员:威廉·配第等 Vs 赫尔曼·康令等

战斗力值:★★★★★ Vs★★★★☆

a.政治算术学派——统计学的始祖

让我们坐上时空机穿越回到17世纪的欧洲——英国,在那里诞生了政治算术。这里的“政治”是指政治经济学,“算术”是指统计方法。它的代表人物就是威廉·配第和约翰·格朗特。

政治算术学派主张用大量观察和数量分析等方法对社会经济现象进行研究的主张,为统计学的发展开辟了广阔的前景。

b.国势学派——我们冠之以名

国势学派产生于17世纪的德国,由于该学派主要以文字记述国家的显著事项,所以又被称记述学派。因在外文中“国势”与“统计”词义相通,这也就是“统计学”之名的由来。其中德国这位Gottfried· Achenwall就是此派系中的代表人物之一,另一位重要人物是赫尔曼·康令。

该学派在进行国势比较分析中,偏重事物性质的解释,而不注重数量对比和数量计算,但却为统计学的发展奠定了经济理论基础。不过这个学派也不是一个省油的学派,就算是同门的还要互相争斗一番。随着资本主义市场经济的发展,对事物量的计算和分析显得越来越重要,这个学派最后还是发生了内讧,分化为图表学派和比较学派。

其实这两个学派在悠悠统计学历史上共存了将近200年,在此期间谁看对方都不顺眼,但也没法称霸天下,无奈两者相互影响又相互争论了许久,直到19世纪中叶,随着近代统计学的建立,统计学具有数量特征的这个关键属性才被牢牢地确定下来,最终依靠数字说话的政治算术派终于被认可为统计学的始祖。

Round 2

决战时间:19世纪

双方战队:数理统计学派Vs社会统计学派

主力队员:伯努利等Vs尼克斯,恩格尔等

战斗力值:★★★★★ Vs ★★★★★

a.数理统计学派——理论在争论中前进

要说这个派系,不得不提概率论。在16世纪20年代,卡尔达诺——是的就是那个酷爱赌博,算命和开方子的意大利数学家,根据他长期的赌博经验,初步计算了他豪赌人生的输赢概率;接着伽利略通过对赌博问题的研究,创立了早期的概率理论;到了17世纪下半叶,雅克布·伯努利发现大数定律中最早的一个定理--伯努利大数定理;最后在19世纪初,法国的拉普拉斯终于集古典概率大成,初步奠定了数理统计学的基础,并于19世纪中叶将其引进统计学进而形成数理统计学派。

在这之后,数理统计学得到迅速发展。英国生物学家高尔顿提出并阐述了相关的概念;K·皮尔逊提出了标准差、卡方检验等方法;戈塞特建立了“小样本理论”——就是那个著名的“学生t分布”;费希尔在样本相关系数的分布、方差分析、实验设计等方面的研究中做出了重要贡献。到20世中期,数理统计学的基本框架已经形成,统计学也逐渐从记述性统计转变为推断性统计。数理统计学派已然成为英美等国统计学界的主流。

尿点时刻到!插播一个小八卦,咱们八一下关于K·皮尔逊和费希尔他俩打架的故事(大牛们掐架这种事最有趣了):

K·皮尔逊就是卡尔·皮尔逊,也被叫做老皮尔逊(因为他还有个儿子,也叫皮尔逊,而且还子承父业也成了统计学家),被尊称为统计学之父。要说他们俩到底为啥事需要如此争锋相对呢,其实就在于统计观点这可以上升到原则的问题。

老皮尔逊把统计分布视为对他所分析数据的集合的真实描述。而按照费希尔的观点,真实分布只是一个抽象的数学公式,搜集的数据只能用来估计这个真实分布的参数。当然大牛们掐架不会没人劝,充当他们俩“调和剂”的角色好巧不巧就落在了那位“学生t分布”的创始人戈塞特身上,真是难为他一次又一次的去解读拥有跳跃式思维的费希尔的数学神推导。要知道,戈塞特曾多次抱怨看不懂费希尔大神的数学证明在写什么,因为很多证明过程,费希尔都觉得根本没必要写上去——这不是显而易见的么,还需要证明?于是,就直接有结论了……(你费尽千辛万苦找到了数学分析习题答案,然而证明题后的答案只有:略。——心情大抵如此吧!)

这俩人的观点辩驳持续了很长时间,起初看上去是费希尔在这场辩论中获胜了,没成想后来皮尔逊学派的观点又东山再起.然而此时,统计学界在这个问题上已经分裂成两派。

话说回来,费希尔也不单单就和老皮尔逊过不去,他和小皮尔逊也不怎么交好(是老皮尔逊的儿子没错了)——他就是看不惯叫皮尔逊的人,另外他看不顺眼的还有奈曼。费希尔也是个顽固的人,奈曼的假设检验理论从一开始就受到费希尔的抨击,并且一直持续到费希尔人生的尽头,其抨击精神的坚毅令人佩服!

八卦结束,回到正题。

b.社会统计学派——重“质”的学派

说完数理统计学派,咱就得聊聊社会统计学派了。该学派产生于19世纪后半叶,创始人是德国的克尼斯,主要代表人物还有恩格尔、梅尔等人。这群学家融合了国势学派与政治算术学派的观点,沿着凯特勒的“基本统计理论”向前发展,但在学科性质上认为统计学是一门社会科学,是研究社会现象变动原因和规律性的实质性科学,以此同数理统计学派通用方法相对立。

社会统计学派在研究对象上认为统计学是研究总体而不是个别现象,而且认为由于社会现象的复杂性和整体性,必须对总体进行大量观察和分析,研究其内在联系,才能揭示现象内在规律。这是社会统计学派的“实质性科学”的显著特点。

社会统计学派和数理统计学派的观点对立点就是建立在“质”和“量”的争论上。社会统计学派仍然强调在统计研究中必须以事物的质为前提和认识事物质的重要性,而数理统计学派还是更为侧重计量不计质的方法论。

Round 3

决战时间:20世纪

双方战队:贝叶斯派 Vs The Others

战斗力值:★★★★★ Vs ★★★★★

贝叶斯派——后浪推前浪,前浪……

在近阶段的统计学发展史上,贝叶斯派系的统计学正在逐渐获得越来越多学者的关注,也是推动近代统计学发展的新动力。该学派的主导思想其实来源于贝叶斯的后验概率,它和之前我们所说的各大派系(一般统称为经典统计学派)的区别在于是否利用先验信息。贝叶斯统计学派认为利用这些先验信息不仅可以减少样本容量,而且在很多情况还可以提高统计精度;而经典统计学派则忽略了这些信息。

诚然贝叶斯统计学派与经典统计学派有着较大区别,但是它们各有优缺点,各有其适用的范围。经典统计学历经了时间的洗刷,理论体系已然相当成熟,而贝叶斯统计学派带来的新理念,势必会激起新的一轮方法论研究。两种方法相辅相成,在不少情况下,他们得出的结论在形式上是相同的,在结果上也具有同质性。

我们通过一个时间轴来回顾一下“统计学”小朋友的成长史——

至此,统计学史上的“撕逼大战”终于可以暂时休战了,即便有再辉煌的战绩,那也已然成为了“当年勇”,我们这不还得把眼光放到未来嘛,毕竟瞅着这篇文的你才是“统计学”的新生力量啊!

转自:“量化研究方法”微信公众号

如有侵权,请联系本站删除!


  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com