学量化研究方法的基本路数
2023/7/13 14:23:35 阅读:76 发布者:
以下文章来源于在学术界谋生存 ,作者李连江
万事开头难,知识准备不足,找不到合适的教材,遇不到会教的老师,都是原因。
学量化研究方法,开头难还有个主观因素,就是放不下身段,不愿承认自己是初学,奢望一步登天。教材,喜欢最艰深的,兹不举例;软件,喜欢最难学的,比如R。
如果能抑制虚荣心,不妨采用最容易入门的统计软件SPSS,以SPSS自带的“雇员数据”(Employee Data)为练习数据。
设计个思想实验。假设自己是美国的民权律师兼社会学家,听沃尔玛的员工抱怨公司有种族歧视,因而计划提出一个“集体诉讼”(class action lawsuit),也计划写论文。为打赢官司,发表论文,必须准备证据。调查结果就是雇员数据。
学方法,致用是活力之源。选定这个场景,数据就活了。活用数据,过三关。
第一关,正态分布。逐渐习惯概率思维模式:看频次分析的结果,把频次分析的百分比转换为概率,把累积百分比转换成累计概率。用直方图展示年薪的分布,先习惯从左往右动态读图,后习惯从中间(平均值)开始左右开弓动态读图。培养相对思维模式:样本相对总体;样本统计值相对总体参数;平均值相对标准差;一类错误(弃真)相对于二类错误(纳伪)。相对的意思是,概念成双,相互界定意义。这一关很难真正打通。但是,打不通可以变通。甚至可以绕过,死记硬背几个关键t值的意思,比如:t=1.96,意思是观察到某个样本统计值的概率是5%。
第二关,显著度检验。首先明确一点,“显著”(significant)不等于重要(important),指“值得关注”。比较白人员工与少数族裔员工的平均年薪,分三步透彻理解显著度检验的逻辑。(1)零假设:没有种族歧视。根据零假设做的预测:两组员工的平均年薪相同,差距为零;(2)观察结果:白人员工的平均年薪比黑人员工的平均年薪高7300美元,t=3.91,相应的概率是 p < 0.001;(3)预测某事发生的概率很小,而某事发生了,这说明预测不准。预测的根据是零假设。不能确知零假设真假,必须决定是否放弃它。选择放弃零假设,犯一类错误的概率小于千分之一;选择接受零假设,犯二类错误的风险很大。理解显著度检验的逻辑,可以采用无罪推定原则下的法庭审判作为思想实验场景,自己轮流扮演四个角色:(1)提出诉讼的民权律师;(2)陪审团成员;(3)为公司辩护的律师;(4)法官。
第三关,做回归分析,理解因变量,解释变量,控制变量。
学最小二乘回归,可以做篇论文。
题目:沃尔玛是否存在种族歧视?
因变量:年薪(salary)。
解释变量:族裔地位(minority status)。
控制变量:教育程度(educ)和工作岗位(jobcat)。
研究过程中发现,工作岗位貌似有三个层级的定序变量,其实只有两个层级。构建一个新变量:是否经理(manager),0=普通员工;1=经理。可以用构建的二分变量学习对数回归(logistic regression)。
因变量:是否经理。
解释变量:族裔地位(minority status)。
控制变量:教育程度(educ)。
打通这三关,就入门了。
如果不是想当量化方法专家,只争取当合格的用户,数学基础不雄厚就不是问题,可以靠发挥想象力、逻辑推理能力补救。
不用高等数学,也可以学会量化方法,但这并不意味着量化方法容易学。学,不易;教,也不易。学,要抑制虚荣心;教,也要抑制虚荣心。站在初学者角度,按逻辑顺序排列量化方法的基本要素,按时间顺序排列量化思维的难点。用一条主线把基本要素贯穿起来,用明白生动的比喻把复杂的概念解析成简单的成分,借助具体场景,四种角色,解析多维度的概率思维方式。
转自:“量化研究方法”微信公众号
如有侵权,请联系本站删除!