《哈工大尹海洁社会统计学(第2版)课后习题答案.docx》由会员分享,可在线阅读,更多相关《哈工大尹海洁社会统计学(第2版)课后习题答案.docx(130页珍藏版)》请在课桌文档上搜索。
1、第1章绪论第2章单变量的描述统计分析1.2014年中国普通本科院校情况如下表所示:2014年中国普通本科院校情况院校类型院校数量(所)29135242610315130122331642141202资料来源:中华人民共和国统计局.中国统计年鉴:2015:704.要求:(1)绘制2014年中国普通本科院校情况的条形图;(2)找出众数并计算异众比率。解:(1)绘制条形图。绘制条形图,得图2-1。批注I深度技术H:(2)找出众数并计算异众比率。找出众数。由于理工院校数量最多,所以众数为理工院校。计算异众比率。f-111202-352-n-oz=70.7%N1202异众比率超过50%,说明理工院校这个
2、众数的代表性并不是很好。2.某社区465名60周岁及以上老人养老情况如下表所示:某社区60周岁及以上老人养老情况养老类型人数(人)与配偶或保姆居住225与子女同住165养老院养老32其他43合计465要求:(1)绘制该社区60周岁及以上老人养老情况的条形图;(2)绘制该社区60周岁及以上老人养老情况的饼图;(3)找出该社区60周岁及以上老人养老情况的众数。解:(1)绘制条形图。绘制条形图,得图22。养老类型图2-2这个社区60周岁及以上老人养老情况的条形图绘制饼图。绘制饼图,得图2.3。图23这个社区60周岁及以上老人养老情况的饼图(3)找出该社区60周岁及以上老人养老情况的众数。由于第一类型
3、的人数最多,所以众数为与配偶或保姆居住这一养老类型。3.某班50名学生的统计学考试成绩数据如下表所示:4452576060626365676768697070727373737474757575767677787879798081818384848585858687878788899091929598要求:对上面的数据进行适当的分组,编制频次和百分比分布表,并绘制直方图和饼图。解:(1)分组并编制频次和百分比分布表。对成绩数据习惯上取组距为10,将数据分为6组,得到频次和百分比分布表为表24。表2-4某班统计学考试成绩分组频次和百分比分布表成绩频数百分比(%)40-501250-602460-
4、7091870-80183680-9015309(Moo5IO合计5()I(X)(2)绘制直方图。绘制直方图,得图2-4。成绩图2-4某班统计学考试成绩的直方图(3)绘制饼图。绘制饼图,得图25。国50分以卜咫 5060国 60,70田 7080 80*9090以上图2-5某班统计学考试成绩的饼图4.下表是36名网络用户的年龄数据:单位:周岁36名网络用户的年龄192341152120272029361922233125221934172418162423302332192325403523272233要求:根据上表数据,(1)计算众数、中位数;(2)计算四分位差;(3)计算平均数和标准差。解
5、:(1)计算众数与中位数。将年龄数排序后得表26表2-6年龄排序后结果151617181919191920202122222223232323232324242525272729303132333435364041由于23出现6次,频数最高,所以这36名网络用户的年龄的众数为23岁。计算中位数。N = 36, M、= t 2+)j 2+9) = 2(23 + 23) = 23即这36名网络用户的年龄的中位数也是23岁o(2)计算四分位差。Q25的位置=?=乎=9,%=2044Q,的位置=网=2理=27,。八=2944Q=0s-a5=29-2O=9即这36名网络用户的年龄的四分位差为9岁。(3)
6、计算平均数与标准差。计算平均数。Jx=-i三i-=(15+1617+40+41)=25n36计算标准差。2Z(XL历2(15-25) 1= -yn2=18,=80,x,1255+1880”X=-LJ=70nwi+w230方差为:n.301230U-5r)-30x212+xf-30x2b2=JT=/T=,T3n3030根据变形公式XU-对=力心血:2,r-li-l则第一个样本的方差为:u-1)2U-)2-I2,2z2_jjjzjid得到:E.r12=1212+12H;。/=130同理:2石=18云+18石。=I3于是得:2127:+12吊2+18云+8-30F30= 174126+12552+1
7、842+18802-3070230)+/M33=12(3+ll)+3ll+5(8+5)85+10(14+32)+14x32=1214= 0.2061305-652.a 2231305+652+1214ZZ1+nj+nx1305+652+975d=0206+0223=02i5可见,这100名已婚女性对夫妻关系的满意度和与同事关系的满意程度呈现出一定的正相关关系,但关联程度并不高。第4章两个尺度变量关系的描述统计1 .已知8名高三学生的身高与体重的资料如下表所示。8名高三学生的身高与体重项目学生编号12345678身高(米)X1.551.601.651.671.701.751.801.82体重(公
8、斤)yI50I52I57I56I60I65I62I70一要求:(1)建立以身高工为自变量、体重y为因变量的一元线性回归方程;(2)计算拟合优度。解:(1)建立回归方程。由题意可计算得:=8,元=1.6925,力22.9788,5=59,=28158SwM=803.02r三lr=lJ=IW(XyJ-S803.02-8x1.6925x59bl=j-l-i=-=66.7201,V2-222.9788-81.69252r=l=y-blx=59-66.72011.6925=-53.9238即以身高X为自变量、体重y为因变量的一元线性回归方程为y=bit+blx=-53.9238+66.720Ix。(2)
9、计算拟合优度。相关系数为:xyi-tixy百二唇冷803.02-8l.692559C=/_I=0.946222.9788-81.6925228158-8592所以拟合优度R2=r2=0.9462?=0.8953。说明这8名学生体重的变化中有89.53%是由身高的不同造成的。2 .下表是某住宅小区10个家庭的家庭年收入与人均住宅面积的数据:(1)绘制家庭年收入X与人均住宅面积),的散点图;(2)计算家庭年收入工与人均住宅面积),的相关系数;(3)建立以家庭年收入X为自变量、人均住宅面积y为因变量的线性回归方程;(4)计算拟合优度。解:(1)绘制散点图。绘制散点图,得图42。人均住宅Ifll枳50
10、. 0-10.0-30. 0-20.0-10.0-0.05.010.015.020.025.0家庭年收入图4-2某住宅小区IO个家庭的家庭年收入与人均住宅面积的散点图(2)计算相关系数。 由题意可计算得: =10,工= 10, xa2 =1344.32, y = 23, y; = 6988,Z尤戊=2789相关系数为:xiyi-rixy2789-101023Jl 344 32 -IOxlO? ,6988 10 23?(3)计算回归方程。0.6395XaM一讨 2789-101023 bl= =Siux. = l 42021工2_,反2I344.32-1OIO2% = y-I =23-1.420
11、2x10 = 8.798即以家庭年收入X为自变量、人均住宅面积y为因变量的线性回归方程为 y = b0+blx = 8.798 +1 .4202。(4)计算拟合优度。f2=r2=0.63952=0.4090说明家庭年收入的变动可以解释40.90%的人均住宅面积的变动。3.某研究机构为了解该市居民受教育年限与收入的关系,有选择性地进行了一次小规模调查,其中被调查者受教育年限与月收入的情况如下表所示:受教育年限与月收入的调查结果个体编号受教育年限(年)月收入(元)个体编号受教育年限(年)月收入(元)个体编号受教育年限(年)月收入心1680081217001518570026912230016196
12、100369001()15281719640049900111522181956005915001216281923630069180213163800202362007122114163400要求:(1)绘制受教育年限X与月收入y的散点图;(2)计算受教育年限X与月收入y的相关系数;(3)建立以受教仔年限X为自变量、月收入y为因变量的线性回归方程:(4)计算拟合优度。解:(1)绘制散点图。绘制散点图,得图43。图4-3受教育年限与月收入的散点图(2)计算相关系数。由题意可计算得:zl=20,x=14,=4466y=3220.1,y;=288227204.Za升=1096818相关系数为:iy
13、i-iy/7y-ny21096818-20I43220.1八CrM=-=U.929U4466-20142288227204-203220.12(3)计算回归方程。Z(X/)一问 瓦=乌I=I1096818-20143220.l4466-20142=357.4908=y-blx=3320.1-357.490814=-1784.7712即以受教育年限X为自变量、月收入y为因变量的线性回归方程为y=ba+blx=-784.7712+357.4908x。(4)计算拟合优度。/?2=r=0.92902=0.8630说明受教育年限的变动可以解释86.30%的月收入的变动,受教育年限对月收入的影响很大。4.
14、下表是某社区10名残疾人年龄与受教育年限的统计情况。某社区10名残疾人年龄与受教育年限情况项目编号12345678910年龄X受教育年限y1632192511321133153815459528564633要求:选择一条合适的E由线来二旗合这些数据。解:先做这组数据的散点图图4-4,以观察他们年龄与受教育年限变化的趋势。受教行年限4 2 0 8 1x 1A 1X2060702- I10304050年龄图4-4某社区IO名已离校残疾人年龄与受教育年限的散点图由图4-4可以看出,这10名已离校残疾人的受教育年限随年龄增长呈现出先增长后下降的趋势,所以采取二次曲线9=%+4x+%来进行拟合。由教科书
15、公式(4-19)整理可得b2 =卜2y一/Jk2/)(盯%.力31%2)()其中,死”=挣,耳42,7=A;1 5T/-I1Jr_1“1/=_33%,=_心由所给数据计算可得:=38.1,?=1671.3,=80995.5,7=4196997.3y=8.8,y=316.3,Ty=12517.9带入公式可得:b2(12517.9-1671.3x8.8)(1671.3-38.12)-(316.3-38.1x8.8)(8O995.5-38.1x1671.3)(4196997.3-l671.32)(16713-38.l2)-(80995.5-38.II671.3)2=-0.018(xy-*y)-Ix(
16、1671.3-38.12)b0 = y-blx-b27 = y-blx-b2x2= 8.8-1.33338.1-(-0.018)1671.3 =-11.904即拟合的曲线方程为y = -11.904 + 1.333x-0.018 o-xx2b7%的公式整理后可得:”=7-_2-)代入公式可得:1.333(3163-38.18.8)-(80995.5-38.11671.3)(-0.018)第5章类别变量与尺度变量关系的描述统计1.下表是某高校分属三个专业的18名研究生入学英语考试成绩。某高校三个专业的18名研究生入学英语考试成绩单位:分专业成绩专业一yj859288889089专业二加82849
17、1788683专业三刘818287907880要求:计算相关比率,说明专业与英语考试成绩是否相关。解:由题目数据计算可得:yi=88.7,y2=84,%=83,y=85.29H=47198,2羽=42430$M=41438,yj=131066El=之Z(X-a=tii*2=13166-1885.22=403.28/=IJ-I1-1/=Ie2=(zj-7;)2=-x2=(47198-688.72)+(42430-6842)+(4I438-6x832)=189.86尔二403.28789.86=05292E1403.28计算相关比率得es=73由误差消减比例看,消减掉的误差占总误差的53%左右,相
18、关比率达到0.73说明专业与英语考试成绩有一定的相关性的。2.下表是15名工人分别使用三种方法装配件仪器所需时间。15名工人分别使用三种方法装配一件仪器所需时间单位:分钟方法时间方法一刘方法二加方法三刘121312151815161620221618192428要求:(1)绘制三种方法所需平均时间的条形图;(2)计算相关比率,说明装配方法是否对装配时间有影响。解:(1)绘制条形图。25. OO-20.00-15.00-10.00-5.00-平均时间根据题目数据计算可得:yl=14J2=17.8J3=21J=17.6,得到条形图图5-1。o.oo方法1方法2方法3方法图5-1三种方法所需平均时间
19、的条形图(2)计算相关比率。计算可得:=l06,=1621,=2301J-IH-力Syj=4928/-I7-1E%3nl骂这(刀-=2歹=4928-15x176=281.6I-I-lr-l-lG=(-针=f-汉/=!三1f=1I/=I)=(1006-5142)+(1621-5l7.82)+(2301-5212)=158.8PRE=-S-=2816-158.8=04361EJ281.6计算相关比率得es=0.66.由误差消减比例看,消减掉的误差占总误差的40%左右,相关比率达到0.66,可见不同的装配方法对装配时间有明显的影响,具有一定的相关性。3.为了解大学生网购的情况,某学院进行了一次小型调
20、查,被调查的20名学生在过去的三个月里网购次数的情况如下所示:按性别整理的调查结果性别网购次数男网38640510女刘78319091051232按专业整理的调查结果专业网购次数专业一yij3505专业二用841783123专业三处602190910要求:(1)计算性别与网购次数的相关比率,说明被调查者的性别与其网购次数是否有关(2)计算专业与网购次数的相关比率,说明被调查者的专业与其网购次数是否有关解:(1)计算性别与网购次数的相关比率。根据题目数据计算可得:工=3.375,%=5.75,=4.8=151,f3=567片1Z=Iyj=151+567=718r=l=1月=之(L一刃2=*Z一而
21、2=7182OX4.82=257.2J-I/=Ii=j=mJl2(、2=L(yij-X)2=yl-njyM1/=1IJMl/=(151-83.3752)+(567-125.752)=230.125DDREi-E.257.2-230.125n1PRE=-=-=0.11Ei257.2eta=0.33由误差消减比例看,消减掉的误差占总误差的10%左右,相关比率为0.33,可见被调查者的性别对网购次数有一定影响,但相关性并不很高。(2)计算专业与网购次数的相关比率。根据题目数据计算可得:K=3.25,y2=5.75,%=4.625,y=4.8ZM=592M=356,ZM=303,EEyj=59+356
22、+303=718=1J=Ij=lJ-I-l=(-)2=j-2=718-20x4.82=257.2-l-l/-Ij-l=(-)2=一亚)三yi/yi)=(59-4x3.25?)+(356-85.752)+(303-84.6252)=240.125= 0.07*X=257.2-240.125E1257.2eta=0.26由误差消减比例看,消减掉的误差占总误差的7%左右,相关比率为0.26,可见不同的专业对网购次数也有一定影响,但相关性也不高。4.为了解原居住地区类型与男性居民做家务情况是否有关,在某社区中调查了原居住地分别为城市、县城和农村的16名男性居民,得到他们每周做家务的时间如卜表所示。男性
23、居民做家务时间单位:小时原居住地类型每周做家务时间城市yj673.559县城为3.53.51423.53.5农村功10.523.5要求:计算相关比率,说明被调查者每周做家务时间与其原居住地区类型之间是否相关。解:根据题目数据计和可得:K=6.1,%=3,%=1.75,y=3.65625计算可得:力M=203.25,用=70,为用=17.5y/J-!3ni.=17.5+70+203.25=290.75/=I/=1E1=(y,)-J)2=-riy2=290.75-163.656252=76.86J=IJ=I=1J=If2=(,v-)2=ybny2,=j=!y=,=(203.25-5x6.12)+(70-7x32)+(17.5-4xl.752)=29.45DRrEE,76.86-29.45PRE=-=0.6168E176.86es=0.785由误差消减比例看,消减掉的误差占总误差的61.68%,相关比率高到0785,可见被调查者做家务时间与其原居住地区类型之间有比较强的相关性。5.在东、中、西部三个地区随机抽取了16个环保重点城市2014年空气质量达到及好于二级的天数数据如下表所示。环保目t点城市空气质量达到及好于二级的天数东部地区中部地区西部地区168135187