定性大数据分析报告论文设计.doc

上传人:夺命阿水 文档编号:16244 上传时间:2022-06-30 格式:DOC 页数:13 大小:485.12KB
返回 下载 相关 举报
定性大数据分析报告论文设计.doc_第1页
第1页 / 共13页
定性大数据分析报告论文设计.doc_第2页
第2页 / 共13页
定性大数据分析报告论文设计.doc_第3页
第3页 / 共13页
定性大数据分析报告论文设计.doc_第4页
第4页 / 共13页
定性大数据分析报告论文设计.doc_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《定性大数据分析报告论文设计.doc》由会员分享,可在线阅读,更多相关《定性大数据分析报告论文设计.doc(13页珍藏版)》请在课桌文档上搜索。

1、不同年级与性别对奖助学金渴望度定性数据分析摘要:定性数据分析是数据分析的一个重要内容,它在实践中有着广泛的应用,如问卷调查、产品检验、医学统计等领域中经常用到列联表的定性数据分析来。列联表的定性数据分析不仅可以分析分类特征之间的相互依赖关系,还可以进展检验、似然比检验、相合性的度量和检验、计算相关系数作相关分析也可以进展一致性与读了性的检验。本文主要采用检验、似然比检验、相合性的度量和检验来对不同年级、不同性别的大学生对奖助学金渴望度的独立性、相合性检验,最终得到对奖助学金的渴望度与性别无关、与年级有关。关键词 列联表 检验 似然比检验 相合性度量一、问题简述为了解高某校不同年级不同性别的大学

2、生对奖助学的渴望程度,对某校大一年级、大二年级共80位同学关于奖助学金的调查,并取其中的年级、性别、渴望度三个指标生成列联表,对列联表做定性数据分析。二、符号说明 :卡方统计量:似然比统计量 :统计量 :概率 :相合性度量统计量三、理论方法理论:列联表一般来说,有二维的列联表,假设将个个体根据两个属性和进展分类,属性有类:,属性有类:。个个体中既属于类又属于类的有个。得如下二维的列联表:表一列属性B合计行属性A合计其中,。如果个个体根据三个或三个以上的属性分类,就会有三维或三维以上的列联表,对于高维的列联表一般将其压缩为二维列联表在对数据进展统计分析或对高维列联表进展分层在检验。方法:对二维表

3、中的数据进展检验、似然比检验、相合性的度量和检验。四、数据的来源与数据处理本数据的来自在2014年6月所做的 关于奖助学金的问卷调查,本问卷共发放80份,实际回收77份。其中选年级、性别、渴望程度三个指标统计数据得如下的三维的列联表:(其问卷和原始数据以与选出的三个指标的数据见附录)表二A非常渴望B一般渴望C渴望D无所谓合计A(大一年级A男42107B女8913030B大二年级A男333211B女1193629合计2623208771、列联表的压缩列联表的压缩即把高维列联表某一属性不同情况的数据合并在一起得到低维列联表德尔过程。将表二中不同年级、不同性别的人数分别合并在一起,将三维列联表分别压

4、缩为如下的二维列联表。表三A非常渴望B一般渴望C渴望D无所谓合计A男754218B女191816659合计262320877表四A非常渴望B一般渴望C渴望D无所谓合计A大一年级121114037B(大二年级14126840合计2623208772、列联表的分层列联表的分层即将高维列联表按某一个属性分成几个低维列联表,把表二按年级将三维列联表分为两个二维列联表。表五A非常渴望B一般渴望C渴望D无所谓合计A(大一年级A男42107B女8913030合计121114037表六A非常渴望B一般渴望C渴望D无所谓合计B大二年级A男333211B女1193629合计14126840五、检验与分析5.1、描

5、述性统计对表二中的渴望度数据作柱形图和饼图,分析各渴望度所占的多少和比率。 在柱形图和饼图中可以看出,在所以调查的学生中对奖助学金非常渴望的人最多,其次是一般渴望,再次是渴望,最后是无所谓,也就是说大学生都比拟渴望得到奖助学金的。5.2、压缩列联表的检验与分析1、检验和似然比检验1假设属性相互独立属性不独立2检验当两个属性独立时,根据可知个体在每一类中的概率由和完全确定,所以二维列联表的独立性检验实际上是带参数时的分类数据检验。其统计量是自由度为的统计量,在水平下检验的拒绝域为也就是说,此时可认为独立性不成立,否如此,可认为独立性成立。二维列联表的独立性检验的似然比检验的统计量为:。也可以计算

6、来完成检验,值等于自由度为的变量大于等于统计量的值的概率,如果值如此拒绝原假设,如果值,如此不拒绝原假设。对压缩后的列联即表三性别与渴望度用SPSS进展检验得值和值如下:性别与渴望度的卡方检验表由上表可知且所以不拒绝原假设,独立性成立即性别与渴望度是相后独立,也就是说性别与奖助学渴望度无关。对表四年级与渴望度用SPSS进展检验得值和值如下:年级与渴望度的卡方检验表由上表可知且,所以拒绝原假设,独立性不成立即年级与渴望度是相关的,也就是说年级与奖助学渴望度有关。由于检验和似然比检验得年级与渴望度是相关的,所以对年级和渴望度进展相合性度量和检验,属性之间的相合关系有正相合属性A比拟大的个体,属性B

7、也往往比拟大、负相合属性A比拟大的个体,属性B却往往比拟小。度量列联表相合性的方法有系数、系数和系数。主要用系数来度量年级与渴望度的相合性,其统计量为:其中,而的值在-1和1之间,其值接近1,倾向于认为正相合;值接近于-1,倾向于认为负相合。相合性的检验是原假设为属性A和属性B相互独立,备择属性A与属性B正相合的检验,其统计量为:和,在对称度量表中可以看出相合性检验并不显著,也就是说年级与渴望度不是正相合关系。用对年级和渴望度检验得下表。因为经检验得但远远小于1,且接近于0,而也就是说要拒绝原假设,所以可以认为年级与奖助学金的渴望程度相合性的检验不通过。5.3、分层列联表的检验与分析用分别对分

8、层列联表表五、表六进展检验和似然比检验得:卡方检验值df渐进 Sig. (双侧)Pearson 卡方2.895(a)2.235似然比2.225线性和线性组合1.094Memar-Bowker 检验.(b)有效案例中的 N37a 3 单元格(50.0%) 的期望计数少于 5。最小期望计数为。b 仅对 PxP 表计算,其中 P 必须大于 1。大一年级性别与渴望度的卡方检验表从表中可以看出且即大一年级的男女对奖助学金的渴望度是独立的,也就是说性别与渴望度无关。卡方检验值df渐进 Sig. (双侧)Pearson 卡方1.845(a)3.605似然比3.638线性和线性组合.3141.575Memar

9、-Bowker 检验.(b)有效案例中的 N40a 5 单元格(62.5%) 的期望计数少于 5。最小期望计数为。b 仅对 PxP 表计算,其中 P 必须大于 1。大二年级性别与渴望度卡方检验表从表中可以看出且即大二年级的男女对奖助学金的渴望度是独立的,也就是说性别与渴望度无关。这与表三性别与渴望度的检验和似然比检验的结果一致。六、结论经过分别对压缩列联表和分层列联表的检验、似然比检验与相合性的度量和检验可以认为不同年级的大学生与奖助学金的渴望度有关系,而不同性别的大学生与奖助学金的渴望度是有关系。附页数据序号1234567年级AAAAAAA性别AABBBAB渴望程度BBCBCAB序号8910

10、11121314年级AAAAAAA性别BBBBBBB渴望程度CCCBAAB序号15161718192021年级AAAAAAA性别ABBBBBB渴望程度ACBBBAB序号22232425262728年级AAAAAAA性别BBABABB渴望程度CAACAAA序号29303132333435年级AAAAAAA性别BBBBBA渴望程度CBAACCA序号36373839404142年级AAABBBB性别BBBBBBB渴望程度CCCAABA序号43444546474849年级BBBBBBB性别BBBBBAB渴望程度ABBAACC序号50515253545556年级BBBBBBB性别BBBBBBB渴望程度C

11、BBCAAA序号57585960616263年级BBBBBBB性别BAAAABB渴望程度ABCADDB序号64656667686970年级BBBBBBB性别AABBAAB渴望程度CADABDD序号71727374757677年级BBBBBBB性别AABBBBB渴望程度BABDBDD附页问卷关于奖助学金的问卷调查一.调查目的:深入了解我院来自不同年级,不同环境,不同性别的大学生对奖助学金的使用情况。二调查方式:共发放80份,分两组发放,每组发40份。三问卷设计:1.你所在的年级:2.你的性别:3.你来自:4.你的主要经济来源?5.你在学期间一个月的伙食费?6.你对奖助学金的渴望程度?7.你觉得奖助学金对你帮助大吗?8.请问你拿奖助学金的目的是:多项选择题A.为了得到荣誉B.为了经济上的帮助C.为了以后找工作增加砝D.没有注意奖助学金9.获得奖助学金的次数?10.当你拿到奖学金后,你是如何安排这笔费用的?多项选择题A.请客送礼B.学习之用C.犒赏自己D.生活费用11.拿了奖学金,你用在学习上的去向是什么?多项选择题A.买参考书、资料书B.交学费C.买学习工具12.当你获得助学金时,你打算用多久?13.当你获得助学金时,会有什么感受:多项选择题A.非常开心,下决心科学使用B.蛮开心的,父母一定很欣慰C无所谓D.习惯了E.郁闷,又要请客了

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 在线阅读 > 生活休闲


备案号:宁ICP备20000045号-1

经营许可证:宁B2-20210002

宁公网安备 64010402000986号