投稿问答最小化  关闭

万维书刊APP下载

关于“变量”你必须知道的那些事

2022/6/2 10:52:00  阅读:402 发布者:

在上一篇文章里 我们说明了一个好的研究假设需要具备以下特点:

介绍清楚自变量、因变量是谁

介绍清楚自变量与因变量的关系

假设是可测量的

我们还介绍了自变量和因变量的本质以及区别:

自变量(independent variable) 用于引起、解释、预测因变量

因变量(dependent variable) 是一个研究中被引起、被解释、被预测的东西

那到底什么是变量?关于变量你必须知道哪些基本知识?变量从measurement等级上分类又都有哪些呢?——此篇我们退一步,重新—审视一下关于变量那些不得不说的事儿。

插曲一枚:一说起变量我就想起当年刚到美国读书的时候那让人羞涩的一幕。第一次见导师, 她让我在她办公室坐下就开始了解我的知识基础,以考虑把我分到她的哪个项目。她第一个问题就是你知道什么是dependent variable吗?我摇头。她说你知道什么是variable吗?我又摇头。她于是拿出一张纸来开始给我画图,大概就是我们在上一篇文章里画的变量关系图,一边画一边说,IV就是这个,DV就是这个,我当时张大了嘴使劲琢磨到底她在说什么那大概是我到美国的第五天,别说IVDV了,我的整个世界都在眩晕之中,听谁说话都在想为什么没配中文字幕。她解释了一会发现我还是没反应, 于是就写了一个方程式,Y=ax+b, 说,Y就是dependent variable——我于是恍然大悟,啊,太好了,原来我在美国并没有变成白痴....五年之后我毕业的时候,我跟导师聊天说,你还记不记得我第一次跟你见面,你问我知不知道什么是variable? 她大概是想起了我当时傻乎乎的样子又不忍心嘲笑我,哈哈地笑着说,look how far youve come. (这个故事告诉我们:见导师前要弄清楚什么是变量。)

什么是变量(variable)

变量是一个研究中的主角和焦点。在一个研究中,研究者试图讲清一个故事,这个故事需要时以前的学者没讲过的,这个故事又需要是大家感兴趣和关注的,这个故事还需要是有理有据的。

讲谁的故事呢?就是讲变量的故事。如果我们看“变量”的英文名——variable, 意思是“可以变化的”,对,变量的本质就是“具有可变化特征的因素” A variable is any factor that takes on a varying characteristic, Schwester, 2015 )或者,是“对某个一特征的测量”(A variable is an empirical measurement of characteristics, Babbie, 2013)

这就好比这世界上的知识本来是零零碎碎的散落在各处,就像一个扔满各种东西的杂乱房间,有了变量之后呢就好像我们有了整理箱和抽屉,我们可以把各种东西分门别类放在各个抽屉里里:衣服放在一个抽屉里, 袜子放在一个抽屉里,笔记本放在一个抽屉 .如果我们在抽屉贴上标签,这个标签就相当于“变量名”, 一看这个变量名,我们就知道,这个抽屉里装的袜子,那个抽屉里装的笔记本..等等。

所以变量就是一个抽屉,一个装东西的盒子,是研究者为了把散落在世界上的知识整理成系统、抽象成模型、概括成理论而使用的整理箱。有了变量人就省事了,研究者和研究者沟通就容易了,我告诉你谁是我的因变量谁是我的自变量,你就很容易的知道我的研究要考察什么关系。变量让我们可以实现数理统计的分析,对现实世界的现象找出规律。

2. 什么是变量值(variable value)?

变量值呢,就是一个变量所描述的特征或者数量。一个变量总是对应着多于一个value(因为只对应一个value的叫constant, 常数)。

比如,“性别”这个变量,对应的value有两个,男性和女性,这个人的性别有可能是男也有可能是女,就这么两个value

再比如,“大学生的年级”这个变量,对应的常见value有四个:大一、大二、大三、大四。

所以, 你会发现变量和变量值的关系是这样的:

value()就是“variable”(变量)的特征;

variable”(变量)是“value”(值)所描述的对象。

以下是一些常见的 variable 和它们对应的 value”, 你看看是不是都是这样,变量值都是用来描述变量的特征;变量名是变量值得描述对象:

分清variablevalue这事儿特别重要,好多相关的知识都要以此为基础,比如后续要讲的measurement(测量), 如何做descriptive statistics (描述性统计), 如何做correlation and regression analysis (相关性和回归性分析)等等。

再来看看,下面这几个东西,你能不能分清他们是变量还是变量值,分得清的话,这一条导演就喊过了。

“非常同意”、“比较同意”

“地区”

“天主教”

57岁”

“严格执行”

“汉族”

“河北省”

3. 什么是”nominal, ordinal, interval, ratio variable?

今日重点来了。

接下来我们来说变量可以分为哪几类。变量按不同性质分有不同的方法,比如可以分成自变量、因变量、控制变量—这是按它们的作用。但是这里我们要说另一个维度的划分: level of measurement (测量的等级)来划分。

所谓“测量的等级”,在这里可以简单理解成这个变量的value在多大程度上可以被精准地量化。

举个例子,不同的词语的表达准确度是不同的,在日常生活里,我们说的每句话,如果仔细去区分,也都有不同等级的可量化性。比如以下几句:

我下周就把报告交给你。

我下周二把计划交给你。

我下周二下午把计划交给你。

我下周二下午五点去把计划交给你。

很显然最后一句的可量化程度是最高的,因为它最精准, 信息也最丰富。

然而在研究中,我并不一定总需要可量化程度那么高的数据 ——比如我如果调查了10000个人力资源经理的年龄和他们工资的关系,我可能只需要知道他们是哪一年生的,不需要具体知道他们是哪个月哪个日子生的。虽然这会致使197011日和197061日出生的两个人被标为一样的年龄(48岁),但是对我来说这个精准度可能就足够了。

于是按照变量的可量化程度,我们通常把变量们分为以下几类(越往后,其可以被精准量化的程度就越高):

Nominal variable (名义变量): 这类变量的value都是一些没办法排序也没办法定量的东西,比如以下这些变量: “性别”, “宗教”,“民族“,”专业“, “出生地”,“国籍“。 这类变量的value一般都不是数字,如果是数字,那也不代表着什么数字本身的含义。比如“篮球运动员号”这个变量,虽然有的球员是“29”号,有的是“40”号,这只是为了区分开彼此的“ID 而已,它不代表29号球员就比40号小或者能力差,也没什么其他的含义。

Ordinal variable (有序变量): 这类变量的value可以按照一定逻辑进行排序,从低往高排,或者从高往低排。比如 “一道题困难的程度”(变量值 =不困难,还行,挺困难),“你对某陈述句的同意程度”(变量值=非常不同意,不同意,中立,同意,非常同意) “学生的年级”(变量值=一年级,二年级,三年级)——这些变量的value内容就更丰富了,你看,对于一个normal variable来说,你只能知道它的变量值是什么,不能知道变量值之间的任何关系;而对于ordinal variable来说,你已经可以知道它的各个value之间的高低排序了。

Interval variable (定距型变量): 这类变量的value不仅可以排序,而且每个value之间的数值差(interval) 还是有意义的。比如“华氏度”(Fehrenheit)这个变量,(变量值=1度,2度,3度…. 1度与3度之间差了两度,与2度与4 之间差的温度相同。——反过来看ordinal variable就不具有这个能力了,你说不出“非常不同意”与“不同意”之间的差距是多少,也无法说出这个差距和“同意”与“非常同意”之间的差距是不是一般大,你只能说明他们两个之间在程度上的排序谁强谁弱。再比如说 “几点钟”这个变量也是interval(value =1pm, 2pm, 3pm)1点和2点之间的差距是有意义的,就是一个小时,这跟2点和3点,3点和4 点之间差的一小时是一样的。

Ratio variable (定比型变量): 拥有最高级别的可定量化能力,可以做的分析种类最,多它的value不仅兼具以上三种变量的全部功能,而且它的“零点”是真的有意义的,是指真的为0。生活里好多这种变量,比如,“年龄”,“学生数量”,“工资”——0年就是0岁,0个学生就是没有学生,0元就是没有工资——这些都有实际意义。再看上面的interval variable——0华氏度,不代表没有温度,只是说温度是0这个刻度;而“零点钟”也不代表没有时间,只是代表当时时间的标度是0这个时刻。

总结以上的分类,有两张图送给大家。

来自网络

上面的图解释了图里越往上的变量种类越厉害——因为信息量大,可量化,精准。

下图展示了如何区分四种变量的一个方法:

对于nominal variable: 它们的变量值只能用“相等”或“不等”来表示;

对于ordinal variable: 它们的变量值之间可以用“大于”或“小于”的关系来表示;

对于Interval variable: 它们的变量值之间可以“加减”;

对于ratio variable: 它们的变量值之间可以“乘除”.

Babbie, 2013

OK 变量和变量值的日常就先讲完了,长舒一口气。

那你可能会问我们为什么费这么大劲儿一定要分清变量和值、以及这些变量的不同测量等级呢?

我先不说你猜猜看呢?:)

References:

Babbie, E. R. (2013). The basics of social research. Cengage Learning.

Schwester, R. W. (Ed.). (2015). Teaching research methods in public administration. IGI Global.

来源:刀熊说说

转自:量化研究方法

如有侵权,请联系本站删除!


  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com