投稿问答最小化  关闭

万维书刊APP下载

如何快速筛选无效问卷—论文写作小技巧

2024/2/27 14:48:24  阅读:159 发布者:

本科生和研究生收集的论文数据一般通过互联网问卷平台投放问卷,线上回收数据,方便快捷,但由于线上填写的不确定性,无法确定调查对象对问卷题项是否有误解以及调查对象是否认真填写了问卷,所以,对回收的数据进行数据分析前,必须首先剔除无效的问卷数据。

要注意的是,能进行高级统计分析的数据必须是原始数据,经过问卷平台分析后的数据是没有用的,所以在下载数据时必须下载原始数据。

现在的互联网问卷平台都支持将数据下载为excelSPSSsav.)两个格式的文档,下载的SPSSsav.)格式的数据在导入软件后会出现乱码,并且SPSS软件在前期整理数据没有excel那么灵活。为方便后续的数据筛选和处理,建议将数据下载为excel(按选项序号下载)格式的文件。在下载的数据里,问卷星会自主按照选项顺序为文本赋值,即A选项赋值1B选项赋值2...这与SPSS录入数据时赋值是一样的,所以excel格式下载的数据可以直接导入SPSS

目前在问卷星或腾讯问卷等平台录入问卷时,平台将默认每道题均为必答题,调查对象填写问卷里必答题全部完成后才能成功提交问卷,这个功能有效解决了回收的问卷数据出现空缺的问题,另外,在投放问卷时还可以设置同一个IP或同一登录名只能填写一份问卷,避免出现调查对象重复填写问卷。所以,在筛选问卷时可直接跳过这两步,进行深入筛选。借助excel工具可以大大提高剔除无效问卷的速度。

第一,根据填写的问卷时间筛选问卷

时间限定可以根据问卷的题目数量和深度决定,在问卷投放前,可以自己先认真填写一份问卷,看看具体的时间是多少。例如“新进员工离职倾向调查问卷”中,有28道题,根据题目数量和难易程度确定填写时间大概需要两分钟以上,那么在回收的问卷中,若填写时间少于两分钟的问卷有很大概率是该调查对象没有认真填写问卷,可以认定为无效问卷,利用excel进行筛选除了即可。

打开下载原始数据的excel文档,选择标题行“所用时间”这一列,选择“数据—排序—点击升序”,如下图:

可见,排序后发现仅有2名调查对象所填写的时间小于两分钟,将所用时间少于120秒的行全部选中,删除无效问卷。

第二,根据人口统计学变量信息筛选问卷

将填写问卷的对象和调查对象不一致的问卷剔除。问卷填写对象要与研究对象一致,不能出现研究广东省人民的生活习性,问卷填写对象却为山东省。例如某篇论文研究题目为《中小企业新进员工离职倾向影响因素研究》中,调查对象的主要特征有两个,一是中小型企业,二是新进员工,说明其任职年限在三年以下,若问卷填写的对象为大型企业或工作年限在三年以上说明不符合研究条件,该问卷数据是没有意义的。

若在问卷中调查对象对应的特征信息题目设计为第5题和第6题,如

5. 您在目前公司的工作年限

1年以下 ○ 1-2年 ○ 2-3年 ○ 3年以上

6.您目前所处的企业规模

○ 大型企业   ○ 中型企业  ○小型企业  ○ 微型企业

筛选时可直接定位到第5题和第6题,将选择3年以上(赋值为4)和大型企业(赋值为1)的调查对象筛选出来。

选中excel表格第一行标题行,选择“数据—自动筛选—点击第5题上筛选符合—勾选4—确定”,如下图:

筛选结果显示,在回收的问卷中,有5个调查对象是不符合新进员工这一特征的,然后直接将这5份数据删除即可。

同理,第二个特征的筛选步骤一致。

第三,根据陷阱题进行筛选问卷

什么是陷阱题呢?

量表设计过程中,要设计1-2题的陷阱题。为防止调查对象胡乱填写量表,导致无效数据的混淆,陷阱题是作为甄选无效量表的有效依据。陷阱题的形式一般有以下几种形式:

①规定某道题的答案选项,观察调查对象是否认真读题。如:

您觉得淘宝网的响应性很好,请选择非常同意。

②在量表不同的位置插入两道相似或相反的题目,若调查对象的答案前后不一致,说明这份量表回收的数据信度不太可靠。如相似题目:

继续留在本单位,我的工作前景不会好;

对我来说,在这个单位没有发展前途。

相反题目:

我习惯于自己解决工作中出现的困难

无论工作中遇到的问题大小,我都会主动寻求同事或团队其他人的帮助

③题目中隐含答项。如:

中国首都是( ),请选择题目中的第二个词组。A北京 B上海 C首都  D中国

④在量表的中间或结尾插入一道数学题,观察调查对象是否认真思考题目。如:

4+3*4=_____

确定陷阱题后,利用excel筛选出来删除。筛选的方法步骤和上篇文章中的第一和第二点一样。详细步骤这里就不重复啦。

第四,根据同一问卷相同答案的比例筛选问卷

若一份问卷里选择同一答案的比例过高,很有可能是调查对象随意答题所致,这种问卷数据基本可以判定为无效。相同比例可以依据问卷设计内容和研究对象人为设定。可以直接按量表的总题数计算比例。这里设定,若量表题相同答案比例达80%,即23题量表题里有19个题目答案一致以上的量表无效,需筛选出来删除。

①利用excel函数筛选

首先可以在excel原始数据文件中将陷阱题删除。然后利用COUNTIF复合函数,即MODE函数和COUNTIF函数相结合统计每一份问卷相同答案的最高次数。MODE函数是将每组数据中相同数字次数最多的数值统计出来,即众数,而COUNTIF函数则是将每组数据中的所需统计的某个数值出现次数计算出来。步骤如下:选中第一份问卷题目旁边的空单元格—在单元格里插入函数或直接输入函数=COUNTIF(AA2:AW2,MODE(AA2:AW2))—按回车键确定。如下图:

然后按住第一个函数单元格的+”符号往下拖动,复制函数,就可以得出每份问卷中相同答案的最高次数,

最后,将“相同次数”这一列数据降序排序。结果显示,在回收的问卷中,有两份问卷相同答案比例过高,数据无效,把次数高于19的两份问卷删除。

② 利用SPSS工具统计相同个案数

调查对象填写的时间、来源、IP这些信息也不需要再利用了,为使原始数据更加直观明了,在导入SPSS之前,可以先将excel表格中BF的信息列删除。

步骤一:打开SPSS软件,导入问卷原始数据。步骤:点击文件—导入数据—Excel—选择需要导入的excel数据文件—打开—确定即可。

步骤二:

导入数据后,点击“转换”——“对个案中的值进行计数”,在出现的对话框“计算个案中的值出现次数”中,将目标变量命名为“选项1相同次数”,然后将要统计的量表题第8题至31题选中转移到“数字变量”的框中,点击下面的定义值,出现新的对话框“要计数的值”,将“值”定义为“1”,点击“添加”,将“1”添加至“要计数的值”框中,再点击“继续”→“确定”即可。

值定义为1”的含义就是目前统计的是每份问卷中调查对象选择第一个选项(赋值为1)的次数;值定义为“2”的含义就是统计的是每份问卷中调查对象选择第二个选项(赋值为2)的次数。

计算完成后,结果会在数据视图的最后出现一列新的数据,即“选项1的相同次数”,这列新的数据就是我们所需计算的每份问卷选项1出现的次数。

可以看到,结果是按问卷的序号显示,即第一个调查对象填写的问卷中有4道选择了“非常不同意”(选项1),第三份问卷填写中没有题目是选择“非常不同意”。但是,收集的问卷很多,这样的结果显示是没有规律,我们很难一眼看到哪份问卷是不合格的,所以,得出“选项1相同次数”的结果后,还需要对这列数据进行排序。

步骤三:

对某列数据进行排序有两种方法。

第一,直接选中这列数据,点击鼠标右键,选择“降序排序”即可,这是最简单的排序方法。

第二,点击“数据”→“个案排序”→在出现的对话框“个案排序”中,选中需要排序的数据组名称,转移到“排序依据”的框中→选择“降序”→点击“确定”。

结果下图所示,序号12的问卷中,该调查对象在23道题里有20个题目选择了“非常不同意”,答案相同比例过高,判断为无效问卷,将其删除。

将序号为12的问卷删除后,接下来还要计算选择选项2、选项3、选项4、选项5的相同次数,需要重复以上步骤4次才能将所有的无效问卷找出。

利用SPSS清除无效问卷的步骤相对繁杂,且由于SPSS不具备冻结窗口这一功能,在筛选的时候,数据视图所占篇幅过大,给我们的视觉带来一定的麻烦。建议大家采用excel工具删除无效问卷,比较方便快捷,并且在这一步利用的COUNTIF复合函数也相对简单,计算一步到位,不需要重复多次步骤。

转自论文杂学微信公众号,仅作学习交流,如有侵权,请联系本站删除!


  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com