论文找不到数据做支撑,缺少说服力?实验和调研数据不知道怎么分析?数据分析出来没有意义?数据分析后只会说指标高了低了,不会讨论?
数据的收集和分析对于论文而言非常重要,不仅可以通过数据支撑论文的结论,提升论文的可靠性和说服力;还能在论文中展示研究方法和技巧,体现论文的工作量和科学性。
这一期给大家推荐一些常用的数据查询网址、数据分析工具以及统计分析方法!不会论文数据分析的快收藏起来!
一、数据查询网址
1.国家统计局
网址:http://www.stats.gov.cn/
2.中国知网—中国经济社会大数据研究平台
网址:https://data.cnki.net/
3.互联网行业
(1)艾瑞网
网址:https://www.iresearch.cn/
(2)中国互联网信息研究中心
网址:https://www.cnnic.net.cn/
(3)中国信通院
网址:http://www.caict.ac.cn/kxyj/qwfb/bps/
4.金融财经
(1)第一财经研究院
网址:http://www.cbnri.org/
(2)东方财富网
网址:http://data.eastmoney.com/center/
5.消费类数据
(1)中国食品工业协会
网址:http://www.cnfia.cn/archives/category/hangyetongji
(2)消费站
网址:https://www.cbndata.com/report?page=11
6.影视传媒
(1)中国电影数据信息网
网址:https://zgdypw.cn/#/root.html
(2)猫眼专业版
网址:http://piaofang.maoyan.com/dashboard
7.其他
(1)公共卫生科学数据中心
网址:http://www.phsciencedata.cn/Share/
(2)中国棉纺织行业协会
网址:http://ccta.org.cn/tjjq/
(3)中国半导体行业协会
网址:http://www.csia.net.cn/Index.asp
(4)中国产业信息网
网址:http://www.chyxx.com/
二、数据分析工具
1.Excel(适合入门)
Microsoft Excel是微软公司的办公软件,不仅能够罗列数据、展示数据、还能进行数据分析。
主要功能:
①制作表格;
②绘制图表;
③函数应用;
④数据分析;
⑤VBA(功能自定义,用户可以通过编写脚本或宏来自定义和扩展Excel的功能)。
2.SPSS(科研必备)
SPSS拥有丰富的统计分析方法,如方差、标准方差、正态分布、F检验等。对于学术人而言,Excel适合做一些简单的数据统计,如果处理的数据较大,使用SPSS会更高效、准确率也更高。
3.Python(适合进阶)
Python是一门面向对象的编程语言,编译速度超快。功能十分强大,集数据爬取、数据分析、数据可视化于一体,因此需要一定的编程基础。
三、常用统计分析方法
1.相关分析
用于现象之间数量关系的统计方法,如分析人均GDP与人口预期寿命之间、教学经费与教学效果之间的关系等。其主要目的是分析现象间相关关系的密切程度和变化规律,主要包括三个方面:
①确定现象之间是否存在相关关系:判断现象之间是否存在依存关系是相关分析的起始点。只有存在相互依存关系,才有必要和可能进行相关分析。
②确定相关关系的表现形式:判明了现象相互关系的具体表现形式,才能运用相应的相关分析方法去研究。
③判定相关关系的方向和密切程度:现象之间的相关关系是一种不严格的数量依存关系,相关分析就是要从这种松散的数量关系中判定其相关关系的方向和密切程度。
2.回归分析
指的是根据相关关系的具体形态,选择一个合适的数学表达式,来近似地表示变量间的平均变化关系。换句话说就是在使用相关分析说明两个变量之间相关的方向和密切程度后,继续使用回归分析就能说明两个变量之间的数量变化规律。回归分析按照不同的划分方式进行划分:
①按变量之间相关的形式,分为线性回归与非线性回归:顾名思义,线性回归是指变量之间的相关形式是直线相关,非线性回归是指变量之间的相关形式是曲线相关。
②按自变量的个数,分为一元回归与多元回归:一元回归是指一个自变量与一个因变量之间的数量关系分析。多元回归是指两个或两个以上的自变量与一个因变量之间的数量关系分析。
3.方差分析
方差分析是检验多个总体均值是否相等的一种统计方法,即当检验多个样本所属总体是否有明显差异时,应该使用方差分析方法。方差分析中对因变量的各总体分布有三个基本假定:
①各总体应服从正态分布:对于因素的每一个水平,其观测值均来自正态分布总体的简单随机样本。
②各总体的方差应相同:对于因素各水平对应的各组观测数据,是从具有相同方差的正态总体中抽取的。
③各总体相互独立。
4.聚类分析
目的是将事物按其特性分成几个集群,使同一集群内的事物具有高度相似性;不同集群的事物具有高度的异质性。对于衡量相似性,一般使用距离(如欧几里德距离、马氏距离)。对于建立聚类的方法,可分为:
①层次聚类法:此法先将每一事物当成一个点,计算每一点间的距离(或适配度),将最接近的两个点合并成一个群体,少了一个点后,再重新计算每一点间的距离(或适配度),再将最接近的两个点合并成一个群体。如此,逐次缩减点数,直至所有点均合并到一个群体为止。
②非层次聚类法:最常被用的方法为K平均值法(K-means method),K即其组数。假定有K组,就得先安排K个种子点(seed point),然后按如下步骤处理:
a.将原始事物分为K个群体。
b.计算某一事物点到各聚类重心的距离,将其分配到最接近的群体。
c.重新计算增加及减少事物点的聚类的重心。
d.重复前两个步骤,直至各事物点不必重新分配到其他聚类为止。
③两步聚类法:以层次聚类法(最好是华德法或平均连锁法)取得聚类数目,计算出各群的重心。再以各群的重心为种子点,投入K平均值法进行重新分群。
转自MBA MEM在职研论文指导微信公众号,仅作学习交流,如有侵权,请联系本站删除!