学好定量需不需要数学基础?需要多少数学基础?
2022/7/14 14:10:56 阅读:148 发布者:
文章来源:来点方法
前言本文的主题是回答这样两个问题:“学好定量需不需要数学基础?需要多少数学基础?”本文将以笔者的个人经历为基础,在总结自己的得失中以随笔的形式分享笔者个人的看法。
学好定量需不需要数学基础?
需要,但也不完全需要。 不需要的原因有四:
1) 在越来越复杂的模型和越来越大的数据量面前,人工几乎起不到任何作用,甚至连最基础的均值、方差都不再是人工数学计算完成的,而是通过各种工具完成的。2) 随着各类数学统计工具的完善和学术社群的发展,几乎所有的统计方法/模型都有对应的软件/包可以使用,使用者只需要简单的调用就能得到想要的结果,基本不需要数学基础知识来计算。3) 在软件/包可以满足绝大多数的使用场景的情况下,学习软件/包远比学习数学基础有用。举例来说,如果想做自然语言处理分析,那学习Jieba、Snownlp写好的程序就远比学习特征向量和向量距离的几十种算法来得实用。前者能让你在30分钟内开始对文本的分析,而后者可能需要数个小时的时间来了解各种不同的文本向量化方法。4) 对社会学来说,理论、逻辑乃至数据本身都远比模型的复杂度重要。对难得而实用的数据的描述性统计(比如人口普查数据)远比计算出的复杂模型结果有价值。 需要的原因也有三:
1) 没有数学基础,你可能甚至看不懂这些为你准备好了的软件/包的教程,抄都不知道该改哪个参数,更别说使用了。2) 没有数学基础,对软件/包得到的结果(尤其是系数)的理解会出现错误。最常见的谬误来自于对p值的理解:当软件告诉你某个回归系数是0.001或者0.25的时候,它表达的含义(数学含义和理论含义)究竟是什么?(在多元回归分析中,对某一自变量X的系数的t检验结果的p值<0.001的正确解释应该是:在一系列假设、控制其它变量的情况下,X和Y之间的回归系数(也可以说是净影响)显著地不为零,即,X与Y的【真实】回归系数(x每变动一个单位,y随之变化的大小)分布在0周围的概率为p(【周围】的含义要以P值的计算是单边检验还是双边检验而定)。)它究竟对你想要研究的问题有无实际意义?3) 没有数学基础,在从数据到理论的逻辑推导中非常可能出现漏洞,而这些漏洞可能从根本上影响最终的研究结果。以作者为例,在某次论文写作中,由于我在初步分析中没有一个变量一个变量地扣系数的数学含义和理论含义,导致模型设置出现了遗漏关键一次项的重大纰漏,直接使最终的结果和真实情况截然相反,差点闹了大笑话。 总而言之,无论是需要还是不需要数学基础,【数学】对研究者来说都只是一个为研究服务的工具。工具太精则费时费力、舍本逐末,工具太废又囫囵吞枣、事倍功半,实在令人烦恼。
学好定量需要多少数学基础?
既然明确了【数学基础】在定量研究中的工具作用地位,其实回答“需要多少数学基础”也并不是难事。研究者只需要学习【与研究需要】相适应的数学基础就行了。 当然,这是一句没什么可操作性的废话。下面简单说一下我的理解,也算是对自己未来学习研究的勉励。 1) 比较闲的情况下,可以真的补一下基础。这里的基础,指的是微积分、线性代数、概率论、数理统计、实变函数、泛函分析、随机过程、抽象代数、点集拓扑这些比较硬核的数学基础。可以说,所有的分析方法都是对这些基础数学工具的应用。如果理解了这些基础数学工具,那理解和使用各种分析方法自然会更加得心应手。当然,也不用专门去修数学系的数学基础课程,给一般理科院系准备的线上课程就足够了。补这些内容完全是长期的自我投资,当成健身减肥或者修二外一样理解就行。2) 有时间的情况下,可以带有目的性地修读方法应用课程,包括python基础、因果推断、计量经济学、社会统计学等等。这些课程会教授基于不同数学基础的各种方法,以及对应的软件的使用方法,但本身往往并不需要你真的去使用、用笔演算各种数学过程(几百乘几百的矩阵要怎么手算?),因此也是在不那么着急用上、想提高自己定量方法水平时不错的选择。3) 实在没时间了,可以当临时抱佛脚的抄代码/调参大师。当你已经确定了自己想要研究的课题、自己想要使用的方法、想要达成的效果后,最简单直接的方法就是打开百度/CSDN/Github/Bilibili/STATA社区直接搜索别人是如何实现的,然后对着别人的帮助文档和案例一个一个抄就行。虽然你可能对机器学习的逻辑一窍不通,但依然可以用snownlp完成对上万条微博语录的情感分析,完成一篇有模有样的论文/报告。
小结
对社会科学研究来说,各种方法都只不过是研究的工具,数学基础及由其发展出的各种统计工具也是。对待工具,学习者/研究者要能够闲时“磨刀不误砍柴功”,忙时“临阵磨枪不快也光”。这大概就是我对【定量研究要不要数学】的理解吧。
转自:量化研究方法
如有侵权,请联系本站删除!