数据处理、统计方法与数据分析.ppt

上传人:夺命阿水 文档编号:250663 上传时间:2023-03-27 格式:PPT 页数:100 大小:13.26MB
返回 下载 相关 举报
数据处理、统计方法与数据分析.ppt_第1页
第1页 / 共100页
数据处理、统计方法与数据分析.ppt_第2页
第2页 / 共100页
数据处理、统计方法与数据分析.ppt_第3页
第3页 / 共100页
数据处理、统计方法与数据分析.ppt_第4页
第4页 / 共100页
数据处理、统计方法与数据分析.ppt_第5页
第5页 / 共100页
点击查看更多>>
资源描述

《数据处理、统计方法与数据分析.ppt》由会员分享,可在线阅读,更多相关《数据处理、统计方法与数据分析.ppt(100页珍藏版)》请在课桌文档上搜索。

1、,学习目的,了解数据处理的程序与方法1、数据的检查与复查2、数的编码3、数据的录入(数据模板的建立与数据库的建立)掌握基本统计分析方法及其操作懂得统计分析方法的选择,一、调查数据的处理,一、数据的审核 1数据审查的基本任务:审查数据的可靠性、标准性和完整性。2数据审核的办法)问卷检查()合格问卷:数据真实;操作规范;填答完整不合格问卷的处理:重做、补救;作废)问卷复查:从完成的调查问卷中,随机抽取515的重新进行调查。一是核实原来的调查员是否真的对个案进行过调查;二是可将两次调查结果进行对比以检查第一次调查的质量,二、数据的编码(将问卷中的文字答案转换成数字的过程),1、封闭式单选问题的编码这

2、类问题,通常调查问卷在设计时就已将答案的代码确定好了。例如:A1 您的性别:男 女A2 您现在读:大一 大二 大三 大四A3 您的 户口是:农村 城镇 假如有一样本是来自农村的大二男生,他在这三个问题上的答案,用编码表示就是121。,、矩阵式问题与表格式问题的编码,你觉得下列现象在你们学校是否严重?(请在每一行适当的格中打),()矩阵式问题,您和您父母的文化程度*,()表格式问题,3、封闭式多选问题的编码,问题:你上大学的学费来源是()1-助学贷款 2-勤工俭学 3-父母给与 4-自己做兼职 5-社会赞助通常,多项选择题编码时,把多项选择题的每一个选项看作一个变量来定义。0代表没有被选中,1代

3、表被选中。这样,多项选择题中有几个选项,就会变成几个单选变量,这些单选变量的选项都有两个,就是选中和未选,即0或1。如上述问题有5个多选项,则可将5个选项分别设置5个变量:A1、A2、A3、A4、A5,这样该问题分解为5个变量,每个变量设置变量值0和1。,假如某被调查的大学生选择的是勤工俭学和父母给与,那么他对此题回答,相应的编码是01100,4、排序题,(1)对选项重要性进行排序例1:您购买商品时在 品牌 流行 质量 实用 价格 中对它们的关注程度先后顺序是(请填代号重新排列)第一位 第二位 第三位 第四位 第五位编码:定义五个变量,分别可以代表第一位 第五位,每个变量的Value都做如下定

4、义:“1”品牌,“2”流行,“3”质量,“4”实用,“5”价格录入:录入的数字1、2、3、4、5分别代表五个选项,如被调查者把质量排在第一位则在代表第一位的变量下输入“3“。,(2)选择排序题:例2:“你认为开展保持党员先进性教育活动的最重的目标是哪三项,并按重要性从高到低排序”。A、提高党员素质 B、加强基层组织 C、坚持发扬民主D、激发创业热情 E、服务人民群众 F、促进各项工作编码:以ABCDEF6个选项分别对应定义6个变量,每个变量的Value都做同样的如下定义:“1”未选,“2”排第一,“3”排第二,“4”排第三。录入:以变量的Value值录入。比如三个括号里分别选的是 ECF,则该

5、题的6个变量的值应该分别录入:1(代表A选项未选)、1、3(代表C选项排在第二)、1、2、4。注:该方法是对多选题和排序题的方法结合的一种方法,对重要性排序题也同样适用,只是两者用的分析方法不同(例1用频数分析、例2用描述分析),输出结果从不同的侧面反映问题的重要性(前一种方法从位次从变量的频数看排序,后一种方法从变量出发看排序)。,5、开放题编码,()固定多种答案类:依次编码或归类编码。如职业;学历;收入;年龄等()文段类:列出答案;合并答案;编码、半开放题编码:封闭题“其他”选项,同上,三、数据的录入,(一)数据的简录:把编码后的数据简单记录下来(为机录做准备)简录的基本形式有两种,即个案

6、式和表列式1个案简录,2列表式简录表表列式简录表是将所有个案的数据都记录在一张表上。如表,*数据录入:将计算机不可识别的形式转换成计算机能识别的形式的过程数据录入有两种力法:机器录入和人工录入常用的录入软件:xcel SpssSPSS(Statiscal Package for Social Sciences)社会科学统计软件包)是世界上著名的统计分析软件之一,SPSS数据的录入,SPSS数据的录入,第一步:建立数据模板:即把调查问卷中的每一个题输入统计软件、在SPSS“Variable View”页面定义一些变量属性,如变量名、变量长度、变量标签、变量的缺失值等等。对于某些变量属性还会拉出对

7、象框,可以作进一步定义、输入问卷每一个变量名、变量标签、和答案编码,、当用户启动SPSS后系统首先显示一个提示窗口,询问用户要SPSS做什么时,把鼠标移至“Type in data”项上单击左键选中,然后单击“OK”按钮,2定义变量,在数据编辑窗口左下角激活(Variable View)变量定义窗口 在此窗口中,定义数据变量的名称、数据类型、宽度、小数位和标记等信息。1)变量名称:Name:变量名,,2)Type:变量的类型Numeric为数值型变量;例如:12345.67 Comma为逗号型变量:用句号分割数据的整数和小数,整数部分从个位开始往前逢3位用逗号分隔。如原始数据12313342.

8、78表示成逗号型为12,313,342.78;Dot为句号型变量:用逗号分割数据的整数和小数,整数部分从个位开始往前逢3位用句号分隔。如原始数据12313342.78表示成句点型为12.313.342,78;Scientific notation为科学计数型变量。如原始数据1231.3表示成科学计数型为12.313E2;Date为日期格式型变量;例如:mm/dd/yyyy Dollar为美元型变量;例如:$12345.67 Custom currency自定义性。String为字符串型变量。,3)Width:数据或字符串的宽度,默认值为8个字符。4)Decimal:小数位数。5)Label:变

9、量标签,用来说明变量所代表的意义。6)Value:变量赋值。7)Missing:定义缺失值类型 8)Columns:定义数据视区中该变量对应列的显示列宽,默认值为8个字符。9)Align:定义数据在单元中的对齐方式。10)Measure:定义度量变量类型。可有Scale、Ordinal和Nominal,它们代表3种变量,第二步:建立数据库:即将问卷调查所得信息或数据输入统计软件在“DateView”页输入数据数据输完之后,最后单击file,选择Save,把输入的数据保存为后缀为*.sav的数据文件。,数据检查,(1)统计方法检查(2)逻辑检查()缺失值的处理:)替代:以该统计量的平均值代替;还

10、可以将缺失值定义为一个没有用到的数字比如0或,然后界定有效选项不包括0或)删除:删除有缺失值的个案或仅在相应的分析中作必要的删除,四统计分析方法,统计分析方法的内容分为单变量分析、双变量分析和多变量分析。统计方法:频数分析、集中趋势分析离散程度分析、差别分析;相关分析、回归分析、聚类分析等*统计分析的类型 描述分析、推论分析,描述统计分析描述统计的主要目的在于用最简单的概括形式反映出大量变量资料所容纳的基本信息首先要确定变量的层次。变量的层次由低到高依次为:定类层次、定序层次、定距层次与定比层次,定类层次是指变量的值只能把调查对象分类。性别分为男、女两值。定序变量的值能把调查对象排列高低或大小

11、,有比较的数学特质。成绩分为优秀、良好、及格和不及格。定距能确定变量值与值之间的距离,具有加减的数学特质。适用较低测量层次的统计方法,也可以适用于较高的层次。,一、单变量的描述统计(一)频数与百分数分析 1.定类层次1)频数分析(frequencydistribution)这是最基本的一种方法描述的是变量取不同值的个案的次数分布情况,一般用频数分布表的形式来表达。假如我们调查某校550个学生父亲的职业,通过频数分析,很容易看出其中农民最多,干部最少。,某校学生父亲职业的频数分布,2)百分率/频率(rates distribution)百分率分布是指变量取不同值的个案的次数相对于总数的比例分布的

12、情况。在SPSS软件中频数分布和频率分布的统计功能可以通过如下步骤获得。某校学生父亲职业的百分率分布,2定序层次 1)累积频数(cumulatefrequency):累积频数就是把频数逐级相加起来。分为两种,一种是向上累加,一种是向下累加。它们的作用是使我们容易知道某值以上或以下之次数总和。2)累积百分(cumulativepercentage)累积百分率就是把各级的百分率数值逐级相加,其作用与累积频数,3定距、定比层次通常定距和定比层次所适用的统计分析方法是基本一致的。由于定距、定比变量的值是非常多的,比如某社区居民每月用于日常消费的费用可能会有630元、700元、850元、1200元等等,

13、如果每个值都要计算其频数有多少就会很麻烦很琐碎。所以对于定距和定比变量,一般是先将各值分成若干组,然后再计算每组的频数。,某社区居民每月用于日常消费的费用频数分布,(二)集中趋势分析(measures of central tendency):用一个数值来代表资料的集结情况。频数分布和频率分布用来简化变量的资料分布情况,但还不够精简,还可以用集中趋势测量法,找出一个代表性的数值来反映变量资料的集结情况。这种方法可以根据这个代表数值来估计或预测每个个案的数值。不同测量层次的变量有相应的集中趋势测量法,1定类层次 众数(mode):频数最大的数值。()定义:样本对变量取值中出现次数最多的值。例如:

14、(众数)()特点:简单直观地描述变量的主要趋势。()注意:一组数据中可能会有不只一个众数。()适用范围:定类变量;当然也可以用来分析定序、定距和定比等较高层次的变量。众数的计算方法是先列出频数分布表,然后找最大的频数,最大频数所对应的变量的取值就是众数众数适合于分析定类层次的变量,,甲校学生的父亲的职业,但是,众值的代表性有多大呢?我们要根据各个个案之间的差异情况而定。如果个案之间的差异很大,众值的代表性就会很低。对于定类变量而言,可以用离异比率(variation)来检测。v=(n-fmo)/n 其中fmo为众值次数,n为个案数。离异比率反映了个案偏离众值的情况。,2定序层次 中位数(med

15、ian简写Md):针对原始数据而言,中位值的计算是将各个案由低至高或由高全低排列起来,位于中间位置的个案的值就是中位数。如这组数据是奇数个,则中间位置的数值为众位数;如取值是偶数个,则中间位置的两个数值的平均数为中位数如某楼栋住户的人数由少至多排列如下:2,3,4,6,8中位数:,3定距、定比层次定距和定比层次的变量是可以作加减运算的,所以可以将所有变量的值相加起来,求取一个平均的数值,即均值或称平均数(mean)平均数是最常使用的中心趋势度量指标。平均数等于变量值之和除以个案数。特点:最有意义的统计量;所含信息量最大;但极易受极端值的影响,与众位数相比不够稳定。如果存在极端值或分布很偏时使用

16、中位数可能更为合适,分析定距变量个案的集中情况 用(Mean):把变量的各个数值相加起来,求取一个平均的数值。比如:某村10户家庭的月收入如下:600元,400元,400元,800元,200元,200元,400元,300元,600 元,300元。每户家庭的平均月收入为420元。,在SPSS中,众数、中位数、均值的计算可由下列操作达成:首先打开 Analyze-Descriptive Statistics-Frequencies进入Frequencies对话框后,在左边的变量列表中选择要统计频数的变量,运用黑色箭头,移入右边Variables(变量)框中。然后单击对话框下边的Statistics

17、(统计量)按钮,展开Frequencies:Statistics对话框,在Central Tendency(集中趋势)项,可以选择计算平均数(Mean)、中位数(Median)、众数(Mode)等统计量。最后单击Continue。单击Chats(图表)按钮,可以选择适当的图表类型,Histograms(直方图),Pie charts(圆瓣图)。然后点击Continue。最后单击OK,运行频数统计程序。输出频数分析结果。对于输出结果,读者既可以在SPSS结果框中双击表或图进行编辑,也可以把统计结果拷贝到Word文档中进行编辑。,举例:假如我们要对某企业公司雇员的受教育年限和当前的薪金进行频率分析

18、。我们可以这样操作:第一步:在SPSS中打开该企业雇员的相关数据库。如下图。,第二步:打开 Analyze-Descriptive Statistics-Frequencies。在左边的变量列表中选择Educational Level(受教育年限)和Current Salary(当前薪金),运用黑色箭头,移入右边Variables(变量)框中。如下图,第三步:单击对话框下边的Statistics(统计量)按钮,展开Frequencies:Statistics对话框,在Central Tendency(集中趋势)项,可以选择计算平均数(Mean)、中位数(Median)、两个统计量。最后单击Co

19、ntinue。如下图,第五步:单击“OK”。出现Frequencies统计结果表。(见下表)在表中我们发现,该公司雇员的平均受教育年限是13.49年,当前的平均薪金是34,419.57元,(三)离散趋势分析,离散趋势测量法是用一个值来反映个案与个案之间的差异情况。离散趋势与集中趋势相互对应相互补充如果个案之间的差异很大,则众数、中位数和均值的代表性就会很低。因此对于每个变量的资料,就要测量集中趋势,也要测量离散或差异的程度,1、定类层次:离异比率(Variation Ratio)离异比率即非众数与全部个案数目的比率。计算公式为,其中,n为全部个案数目,fmo为众数的频数。离异比率愈大,就表示众

20、数的代表性愈小,用众数来作估计或预测时所犯的错误就愈大。,2定序层次:四分位差 四分位差的计算方法,是将个案由低至高或由高至低排列,然后分为四个等分(即每等分包括25的个案),则第一个四分位的值(Q1)与第三个四分位的值(Q3)的差异,就是四分位差(Q),即QQ3-Q1,上图表示四个等分。Q:就是中位数,两边各有50的个案。要注意的是,在中位数的两旁的Q1和Q3之间,共有50的个案。因此,Q1和Q3的差异越大,表示有50的个案的分布越远离中位数,因而中位数的代表性就越小,以之作为估计或预测所犯的错误就越大。,计算四分位差,要先求出的Q1位置和Q3的位置,然后计算在这两个位置上的值的差异。对于一

21、组的数据,Q1的位置和Q3的位置的计算公式为:,其中n是全部个案的数目。,3定距、定比层次 标准差(stand deviation)分析定距和定比的变量的离散情况,最常用的方法就是标准差,简写为S即将各数值(x)与其均值()之差的平方各除以全部个案数目,然后取其平方根,公式*如下:,在SPSS统计软件中离散趋势的分析可以通过下述过程实现:打开 Analyze-Descriptive Statistics-Frequencies进入Frequencies对话框后,在左边的变量列表中选择要统计频数的变量,运用黑色箭头,移入右边Variables(变量)框中。然后单击对话框下边的Statistics

22、(统计量)按钮,展开Frequencies:Statistics对话框(如下图),在Dispersion(离散趋势)项,可以选择标准差(Std.deviation),最后单击Continue。,双变量的相关分析,市场调查中,按照要求抽取了样本,样本可能涉及很多变量,不同变量之间的关系是复杂的。寻找变量间的关系是市场调查必不可少的一项工作。变量间的关系最简单的划分即是有关与无关。在统计学上,我们通常这样判断变量之间是否有关:如果一个变量的取值发生变化,另外一个变量的取值也相应发生变化,则这两个变量有关。如果一个变量的变化不引起另一个变量的变化则二者无关。变量与变量之间的相关程度有强弱之分,可用统

23、计方法予以测量。大多数的统计方法是以0代表无相关,介于0于1之间的数值如果越大,就表示相关的程度愈强。两个变量相关测量的方法有许多种,我们怎样选择呢?首先要主要变量的测量层次:定类、定序和定距。属于不同测量层次的变量,就要用不同的测量法。其次,我们要注意两个变量之间的关系是对称的,还是不对称得。对于两个变量,如果我们能确定自变量(X),因变量(Y),X影响Y,而Y不会影响X,这种情况称为不对称关系,反之,如果我们不知道影响的方向,这种情况就成为对称关系。有些相关测量法是假定变量与变量之间具有对称的关系,有些则假定不对称关系。下面我们来介绍几种基本的双变量的相关测量方法。,一、双变量的相关测量方

24、法(一)双变量相关测量方法介绍 1定距变量与定距变量:Pearson积矩相关测量法(Pearson)积矩相关测量法适合分析两个定距变量的对称关系,相关系数用r表示。r的统计值是由-1至+1,其平方值r2有消减误差比例的意义。2两个定序变量:Gamma系数和dy系数两个定序变量的相关测量用古德曼(Goodman)的Gamma和萨默斯(Somers)的dy系数。前者适合分析对称的关系,后者适用于不对称的关系,但两者的系数值都是由-1至+1,既表示相关的程度,也表示相关的方向,都有消减误差比例的意义。3两个定类变量:Lambda系数(用表示)和tau-y系数两个定类变量的相关测量用Lambda系数(

25、用表示)和tau-y系数。两个系数的统计值都是由0至1,表示相关的强度,不表示相关的方向。都有消减误差比例的意义。适合分析对称关系,tau-y用于分析不对称关系。tau-y的灵敏度高与Lambda。4定类变量与定距变量:eta系数相关比率,又称eta系数(简称E2)使用与分析一个定类变量与一个定距变量的不对称关系,也用来分析定序变量与定距变量的关系。E的统计值是由0至1,E2有消减误差比例的意义。,(二)在SPSS中双变量测量方法的操作在SPSS中上述几种双变量的相关测量方法可以通过两种工具具体操作。一是交叉列表(Crosstabs),二是定矩变量相关分析(Correlate)。1交叉列表(C

26、rosstabs)的运用:打开一个数据文件,单击Analyze,选择Deceptive Statistics,单击Crosstabs(交叉表)命令,打开Crosstabs对话框。左边变量清单中选择一个变量移至Row框中,作为交叉表的行变量:选择一个变量移至Column框中,作为交叉表的列变量。假如我们要分析雇员的性别不同,工作类别是否有差异。我们将Gender(性别)移入Row框中,将工作类别(Employment category)移入Column框中。如图,单击Statistics,选择Correlations(相关性)。如果要分析的是两个定类变量,就在Normal栏中选择Lambda,这

27、里我们选择Lambda。若均是定序变量则需用Ordinal栏的统计量,选择Gamma或Somersd。若一个是定距变量,另一个是定类变量,则用Normal by interval栏中的统计量,选择Eta。,然后,单击Continue。单击Cell按钮,在Counts(观测频数)栏选择Observed(观测值),在Percentages(百分比)栏中,选择Row或Column的百分比(本例选Row),然后,单击Continue。如图,最后单击OK。输出结果。很容易看出在在474名雇员中,从事文秘的女性有206人,男性157人;从事保管的女性没有,男性有27人;从事经理的女性10人,男性84人。工

28、作类别有性别差异。(如图),2两定距/比变量相关分析(CorrelateBivariate)在主菜单单击Analyze,选择Correlate,单击Bivariate,会展开Bivariate Correlation对话框。Correlation Coefficients(相关系数)对话框提供了三种相关系数:Pearson(皮尔逊相关,适用于正态定距变量)、Kendalls tau-b(适合于定序或不满足正态分布的定距变量)、Spearman(斯皮尔曼相关,适合于定序或不满足正态分布的定距变量)。Test of Significance(显著性检验)对话框提供两种检验方式:Two-tailed

29、(双侧检验,如果不清除变量间相关的方向,选择此项),One-tailed(单侧检验,若清楚相关的正负,选择此项)。然后单击OK。,SPSS操作过程:,在上图的对话框中:“Statistics”复选框组,选择要输出的统计量。“Means and standard deviations”复选框:输出变量的均值和标准差。,结果解读:SPSS的两变量间的相关分析(Bivariate)的结果比较简单,输出结果中只有一个描述性统计量表和一个各变量问的相关关系表。如果进行相关分析的变量是两个以上,输出时会分别显示两两变量间的相关关系。1下面为一些基本描述性统计量表。从表中可知,参与分析的两个变量的样本数都为

30、40,土壤侵蚀量的均值为5253(吨坪方公里),标推差为64975:降雨量的均值为6565(毫米),标准差为520952。如图,2下面是相关系数大小及其显著性检验结果表。从图表9.30中可知,土壤侵蚀量和降雨量的相关系数r=0851,显著性水平为0000((2tailed)),因此在相关系数旁以两个*号进行标识,土壤侵蚀量和降雨量的相关性十分显著。图表,、单变量的推论统计,推论统计就是用样本的统计值对总体的参数值进行估计的方法。推论统计常用的方法之一是假设检验。假设检验(hypothesis testing)。当前市场调查在统计推论上较为常用的是假设检验的方法。,假设检验是推论统计一种类型。实

31、际上是先对总体的某一参数做出假设,然后用样本的统计量去进行验证,以决定假设是否为总体所接受。举例来说,某单位职工上月平均收入是210元,这个月的情况与上月没有什么变化,我们假想平均收入还是210元。为了验证这一假设是否可靠,我们抽取了100人作调查,结果得出月平均收人为220元,标准差为15元。显然,样本的结果与总体的结果之间出现了误差。这个误差是由于我们假设错误引起的呢?还是由于抽样误差所引起的呢?如果是抽样误差引起的,那么我们就应该承认原来的假设;而如果是假设错误引起的,我们就应该否定原假设。,为此,研究者先提出虚无假设:H0=210元,即该单位职工本月的平均收入是210元。同时,提出与虚

32、无假设对立的研究假设,H1210元,即该单位职工本月的平均收入不是210元。然后用样本的数据计算统计值,并与临界值相比较。在一定的显著度下,与该显著度相应的临界值可以从相关的检验表中查出。当统计值的绝对值小于临界值时,则接受虚无假设,否定研究假设;当统计值的绝对值大于或等于临界值时,则拒绝虚无假设,接受研究假设。在SPSS中,用作假设检定的推论统计法很多种,可以分为两大类,一是参数检定法,比如Z检定、T检定、F检定。一是非参数检定法,比如x2检定、U检定。两者的检定能力各有不同,而以前者较强。,参数检定法的特点是要求总体具备某些条件,如总体呈正态分布、标准差相等、变量的数值有定距测量层次的特点

33、。非参数检定法其特点是不要求总体数值具备特殊条件,一般不要求是定距变量层次,因而适用于推论定类和定序资料。但是,由于非参数检定法不理会总体的情况,在推论时就较为困难,准确性也会因此而受影响。在总体具备某些条件时,参数检定法比非参数检定法更好。尽管非参数检定法存在一定不足,但只要样本足够大时,其检定力就会大大加强,广告调查抽取的样本量通常是很大的,所以运用非参数检定法也是很有效的。,下面我们介绍单变量假设检定的两种具体情况。(一)总体均值的假设检定从总体中抽取一些样本,计算出样本平均数,为了考察样本平均数与总体平均数差异是否显著,可以采用单一样本T检验。比如我们要调查某外资企业雇员的当前薪金情况

34、,从中随机抽取了474名作样本。假设该企业总体均值是20000元,我们所要求的显著度为0.05,那么样本的当前薪金均值与总体均值之间的差异是否显著呢?在SPSS中,我们可以这样操作:单击主菜单Analyze,选择Compare Means(比较平均值),单击One-Sample T Test(单一样本T检验),然后从左边的变量列表中选择(Current Salary),移入右边的Test Variable框,并在Test Value(检验值)框中输入20000,然后单击OK。出现T-Test统计结果显示框,在该框中看图中显著性检验估计值,如果小于0.05,说明样本的均值与总体的均值差异显著。,

35、双变量相关的推论统计,我们可以运用上面几种方法对样本中两个变量之间的相关性进行分析。但是,在样本中两个变量相关,并不一定意味着它们在总体中也相关,怎样运用样本的资料来检定在总体中两个变量是否相关呢?SPSS提供了几种较为常用的方法,我们介绍两种,一是X2(Chi-squre test)检定,二是单因素方差检定(即One-Way ANOVE)。,(一)X2(Chi-square test)检定X2检定是非参数检定法的一种,要求两个变量都具有定类的性质;样本是用随机方法抽取。当然此方法也可用于分析高测量层次的变量。在SPSS中X2检定的操作如下:打开一个数据文件,单击Analyze,选择Decep

36、tive Statistics,单击Crosstabs(交叉表)命令,打开Crosstabs对话框。从左边的变量表中选择一个变量移至Row框中,作为交叉表的行变量:选择另一个变量移至Column框中,作为交叉表的列变量。比如我们将Gender(性别)移入Row框中,将Employment category(工作类别)移入Column框中。单击Statistics,选择Chi-square,并在Normal栏,选择Contingency coefficient(相依系数)。注意:卡方检验的目的是检验行变量和列变量是否独立无关,相依系数用来描述行变量和列变量关联性的高低。然后,单击Continue

37、。如图,单击Cell按钮,在Counts(观测频数)栏选择Observed(观测值),在Percentages(百分比)栏中,选择Row或Column的百分比(本例选Row),然后,单击Continue。Format(格式)项接受缺省设置,最后单击OK,运行交叉表统计程序。输出结果。在表卡方检验(Chi-square test)中,我们可将皮尔逊卡方检验(Pearson Chi-square test)显著性检验概率与0.05比较,如果小于0.05,说明行变量与列变量之间有显著关联,即总体中男女在工作类别上存在显著差异。在该结果中,皮尔逊卡方显著性检验概率为0.000,小于0.05,性别与工作

38、类别的相依系数为95.463,两者相关联的程度高。所以可以推论总体中男女在工作类别上存在显著差异。如图,(二)单因素方差分析(One-Way ANOVE)中的F检定单因素方差分析(One-Way ANOVA)中的F检定,属于参数检定法中的一种。主要用来推论总体中多个样本的均值是否存在差异。其适用要求有:随机样本;变量中有一个变量是定距变量;总体是正态分布;具有相等的方差。对于后两项要求,很多研究都不大理会。假如我们已知样本中4个小组成员每天平均上网时间不同。那么,总体中不同小组成员的平均上网时间差异是否显著呢?在SPSS中,可以这样操作:,、在SPSS中整理输入数据。(见下表),2打开数据文件

39、,单击Analyze,选择Compare Mean(均值比较),单击One-Way ANOVA。见下图,3选择并移动变量上网时间至Dependent List(因变量列表)中,选择并移动小组至Factor(因子)框中。如图表,4打开Post Hoc复选框组,选择LSD多从比较。如图表,5打开Option复选框组,选择附加的统计分析项目,本例选择描述性统计(Descriptive)和方差齐性分析(Homogeneity of variance test)。选择Mean plot,用各组的均数制图,以直观地了解他们,本例选择此项。在Missing Values复选框下,选择Exclude case

40、s analysis by analysis:具体分析用到的变量有缺失值去除该记录。6完成设置后,单击“Continue”,返回One-Way ANOVA对话框。7所有设置确认无误后,单击“Continue”,进行单因素方差分析,得到输出结果。如图表,8结果解释,五统计方法的选择,选择统计方法要考虑两个因素调研问题的性质:描述性的问题:频率分析和描述性分析关系性的问题:方差分析、相关分析、回归分析数据资料的性质质变资料(定类量表):频率分析;非参数检验量变资料(定距或定比量表):定序量表也可以转换量变资料:几乎所有的统计方法都可以用,六统计图,线形图饼状图简明柱形图三维柱形图(具体在spss学

41、习时了解),七、数据的归纳分析,所谓归纳,借助概念、逻辑推理、抽象和综合等思维方式对经验材料进行,由表及里、由特殊到一般、由感性认识上升到理性认识的加工制作,从而揭示事物的本质和内在联系。市场调查不能仅仅停留在事物的表面,对现象作经验的措述,必须透过现象,即事物的外在联系,来揭示其本质和内在联系,概括出一般的普遍规律来,要做到这一点,必须在对调查数据进行整理、分类、简化、汇总和统计分析的基础上进行思维加工,最终发现规律。,(一)归纳的原则,1归纳要兼顾定量分析与定性分析定性分析,是要确定现象的性质,划分事物的类别,运用抽象概念对同类事物作出概括。定量分析尽可能地对现象的数量特征和各因素间的相互

42、联系进行精确的定量分析,这样才能深刻、准确地认识市场现象。2理性归纳必须运用多种分析方法统计分析方法必须和其他分析力法结合运均才能更好地发挥作用。统计分析方法能够帮助发现市场现象中不易察觉的规律,但对规律的解释要借助于有关学科的理论。,(二)理性归纳的一般步骤,1资料审读和总体性思考2个体资料和典型事例的理论分析3分项数据和调查分主题的理论分析4全部资料和调查主题的理论分析5结论及其意义的理论分析,(三)归纳的方法,1比较法2因果分析 3结构一功能分析结构一功能分析是在分析某一市场现象时,探寻这一现象在一定的市场系统中所发挥的作用和影响,即它所担负的市场功能,以及这一市场系统和系统各个组成部分的结构。并将某一部分结构与某种功能对应起来。,结构-功能分析的步骤:,首先,把所研究的现象置于一定的市场系统中说明这一系统的内部结构与外部结构,分析这一现象在市场系统中的地位和作用,它对市场运转和市场发展具有何种功能。其次,从性质上和数量分析这一现象与其他现象的联系。再次,讨论各种现象的积极作用与消极作用,表面作用和潜在作用。最后,结合各种分析对这一现象作出说明和解释。优秀的调查报告不是罗列大量的数据和图表,或者只对数据和图表做简单的描述。而是应该能从收集到的庞杂的数据和资料中得出结论性的成果,并且提出对客户具有实际参考价值的意见和建议。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 在线阅读 > 生活休闲


备案号:宁ICP备20000045号-1

经营许可证:宁B2-20210002

宁公网安备 64010402000986号