《基于因子分析和聚类分析对全国地区的经济发展水平的评估.docx》由会员分享,可在线阅读,更多相关《基于因子分析和聚类分析对全国地区的经济发展水平的评估.docx(9页珍藏版)》请在课桌文档上搜索。
1、基于因子分析和聚类分析对全国地区的经济开展水平的评估学院:理学院专业:统计学学号:姓名:指导老师:2013年4月25日摘要中国正处于经济开展的时期,但仍有局部经济开展速度过慢的地区,为了提出相关政策对这些地区的经济开展水平进行改善,通过因子分析,聚类分析对全国所有地区的经济开展水平,进行分类,针对属于不同类的地区实行不同的相关经济政策。为国家制定相关政策提供了数据依据。关键字:城市经济开展水平;因子分析;聚类分析;分类;引言:全国经济开展是由各地区的经济开展一起带动起来的,因此各地的经济开展水平的速度是与国家的开展水平成正比的,而对于全国各地区经济开展水平研究的比拟少,通过经验以及一些试验可以
2、知道经济开展水平根本与人均进出口总额,人均财政收入,各个产业的开展,环境保护,教育支出,废物处理比率,人均日生活用水量,各地区人均GDP,地区生产总值,地区生产总指数,居民消费总指数这些数据有关,使用SPSS对这些数据进行因子分析与聚类分析。也即是在因子分析的根底上进行聚类量化的评估。找出这些地区的开展水平差距所在。1因子分析的根本思想1.1 因子分析的根本出发点将原始指标综合成较少的指标,这些指标能够反映原始指标的绝大局部信息(方差),这些综合指标之间没有相关性。1.2 因子变量的特点(1)这些综合指标称为因子变量,是原变量的重造;(2)个数远远少于原变量个数,但可反映原变量的绝大局部方差;
3、不相关性;(4)可命名解释性。1.3 因子分析的根本步骤(1)确认待分析的原始变量是否适合作因子分析:(2)构造因子变量;(3)利用旋转方法使因子变量具有可解释性;(4)计算每个样本的因子变量得分。1.4 因子分析的数学模型数学模型(Xi为标准化的原始变量;Fi为因子变量;kp)也可以矩阵的形式表示为:X=AF+allaImA=:,-:aplap2、因子分析实验过程首先将数据导入spss中,进行DimensionReduction中的Factor进行分析,选取所有需要分析的变量即是经济开展水平根本与人均进出口总额,人均财政收入,各个产业的开展,环境保护,教育支出,废物处理比率,人均日生活用水量
4、,各地区人均GDP,地区生产总值,地区生产总指数,居民消费总指数进入Variables窗口。在DeSCriPtiVeS对话框中选中statistics框架中的UnivariateDescrpitives,CorrelationMatrix框架中选择Significance来进行显著性的检验如表一所示表1相关矩阵显著性检验CorrelationMatrixa居民消费总指数地区生产总值亿元)地区生产总指数各地区人均GDP(元)人均日生活用水量(升)污水排放量吨)财政性教育经费支出(万元)空气质量到达及好于二级的天数(天)第一产业人均元)M,-产业人均(元)第三产业人均(元)人均财政收入(元)人均进
5、出口总额美元)Corr居民消费总elati指数1.000-.296-.129-.273,234-.232-.298-.348.279-.356-.356-.322-.203on地区生产总值亿元)-.2961.000-.451.402,123.956.949.048.076.500.500,056.290地区生产总-.129-4511.000-.405,287,432-.439.051.124-.373,373-.391-.627指数各地区人均GDP(元)273.402-.4051.000-.041.261.302-042325.922.922.630.825人均日生活用水量(升).234.12
6、3-.287-.0411.000.269.081264.150-.122-.122.137.168污水排放量(吨)-.232.956-.432.2612691.000.931.135.107.364.364-.013.220财政性教育经费支出万元)-.298.949-.439.302.081.9311.000-.009.022.383.383OOO.279空气质量到达及好于一级的天数(天)-.348.048.051-.042264,135-.0091.000.292-.008-.008.068-.072第一产业人均元).279.076.124-.325.150.107.022,2921.000
7、-.327-.327-,497-.519第二产业人均元)356.500-.373.922-.122.364.383-.008-.3271.0001.000.635703第三产业人均元)-.356.500-.373.922-.122.364.383-.008-.3271.0001.000.635.703人均财政收入元)I-.322.056-.391.630,137-,013.000.068-.497.635.6351.000.790人均进出口总额(美元)-.203.290.627.825.168.220.279Q72-.519.703.703.7901.000a.Thismatrixisnotp
8、ositivedefinite.由表一我们可以知道原是变量之间的相关性较强,适合使用因子分析进行分析。对于因子分析我们可以考虑对因子分析进行旋转,然后进行研究,所以这里我们对因子分析中的需要选择Roation对话框中,对其进行VarimaX旋转得出的结果如下列图所示(图1),也会得到旋转后的因子载荷矩阵(表2):图1旋转后的因子分析图表2因子旋转后的载荷矩阵由该矩阵我们可以得到人均进出口总额=0.889*facl+0.136*fac2+0.270*fac3-0.066fac4同理我们可以得到其他原始变量与主成分1,主成分2,主成分3,主成分4的关系式。主成分得分后,用新得到的4个主成分得分后,
9、因子得分系数矩阵如表3所示。我们得到一个新的矩阵表2所示,到这一步因子分析完成了,用4个主成分变量来代表开始的13个原始变量,消除了指标之间的相关性,有减少了变量之间的维数。表3因子得分系数矩阵Component1234居民消费总指数-.075.011.455-.266地区生产总值(亿元).127.262-.075-.100地区生产总指数-.111-.062-.378.059各地区人均GDP(元).161-.110-.007-.008人均日生活用水量(升).012.114.450.349污水排放量(吨).110.296-.016-.033财政性教育经费支出(万元).115.267-.077-.
10、151空气质量到达及好于二级的003.086-110.661天数(天)第一产业人均(元)-.070,218.029.146第二产业人均(元)166-.079-101-.018第三产业人均(元).166-.079-.101-.018人均财政收入(元).122-.204.112.217人均进出口总额(美元).153-.131198.036通过因子得分系数矩阵我们得到到4个主成分的得分。即是facl,fac2,fac3,fac4这几个主成份,在通过计算我们计算出综合得分如表4所示,计算综合得分公式为:F=(34.961*facl+26.106*fac2+12.158*fac3+10.967*fac4
11、)/84.192计算后得出如下表(表5)所示:表5中国各省经济开展水平的主成份及综合得分地区F2F3F4F北京1.97112-0.225360.99014-1.89340.644984天津2.24939-0.7969-2.136990,813890.484388河北-0.383240.69853-0.31376-0.6691-0.07501山西0.15715-0.3879-L42718-0.52886-0.33001内蒙古0.03346-0.12788-1.157790,50576-0.12707辽宁0.189840.4691-0.860410,382420.149854吉林-0.32887-
12、0.3692-0.944510,76656-0.28759黑龙江-0.31884-0.21161-0.24676-0.73025-0.32877上海3.76346-0.633341.17190.521351.603554江苏0.551672.162860.48732-0.029750.966237浙江0.705171.333790.57253-0.071730.779739安徽-0.603160.04143-0.16963-0.62616-0.34368福建0.028780.210450.36849L235490.291358江西-0.46268-0.30890.080980,74935-0.
13、17861山东-0.027051.95579-0.916210,075760.472775河南-0.604551.07339-0.68705-0.68211-0.10628湖北-0.664570.193060.56611-0.46017-0.19429湖南-0.740540.259080.622850,48082-0.0746广东0.235082.674311.245970,755521.205207广西-0.81134-0.214651.635930,37591-0.11826海南-0.97121-1.00972.399340,89812-0.25291重庆-0.27118-0.65166-
14、1.085390.40124-0.41915四川-0.862510.54903-0,23030,30865-0.18097贵州-0.59739-0.86092-0.849710.86341-0.52526云南-0.63385-0.31182-0.98684L47566-0.31018西藏-0.09141-1.636850.97273L84989-0.16107陕西-0.23981-0.36371-0.3223-0.72298-0.35308甘肃-0.4182-0.68463-53907-2.59827-0.78083海-0.25995-1.238310,6611-0.83725-0.50551
15、宁夏-0.20232-1.19460.74944-S89857-0.46326新疆-0,39247-0,392860.20071L7112-0,47871对表5中的数据进行聚类分析,也就是说在因子分析的根底上对数据进行聚类量化,将表5的数据导入spss中进行聚类的分析因为这里的分析要求较高所以这里选用系统聚类,下面将运用系统聚类方法对因子分析中产生新的4个变量进行30个省域城市循环经济开展水平聚类,并按7类进行划分,此次聚类采用新的4个变量作为自变量,地区为因变量,在选择聚类的类数时,我们选择了分为7类,因为7是系数图一个拐点(图4)以便得到的结果,聚类图(图3)如下所示:Dendrogram
16、usingAverageLinkage(BetweenGroups)图3系统聚类图图4聚合系数图由这两个图我们可以知道每个类中包含的样品。可得到如下的结果:第-类:上海作为中国的沿海城市,也是一个国际的大都市经济开展快速这是必须的第二类:北京做为我国的首都,对于经济开展仍然是较快,但因为地理位置不如人意,所以经济开展就比上海差点。第三类:天津是国家的工业基地,经济开展速度也很快。第四类:山东,广东,浙江,江苏这四个城市是国家的几个重要的经济基地所以其开展速度也应当是快速的。第五类:广西,海南,西藏开展就开始缓慢了,而作为第七类:新疆,甘肃,宁夏,吉海就是中国经济开展水平较慢的地方了,这些地方的
17、地理位置对于经济来说是薄弱的。其他为第六类这些城市在开展水平也比拟慢,但附近有很多开展较快的城市所以也促使这些城市开展加快。3、结论本文通过因子分析找出了不相关线性变换将各因素重新组合,剔除了多重共线性的影响,从而找到重要因素,防止主观随意性。在此根底上用聚类分析把城市经济开展水平相似区域归在一类,既可以发现共性,又可以区分差异,由于满足完备性而不会丧失信息。本文结果是在因子分析根底上用聚类方法得到的。可以看出共性,即聚类结果和各地区的城市经济开展水平的排序有一定关系排名129三个城市在经济开展水平中处于较高的地位。由此可见聚类分析适合于不同地区城市经济开展水平问题的研究,且因子分析根底上的聚
18、类结果剔除了指标间相互影响,其精确度明显提高。而且可以发现因子分析和聚类分析起到个互相补充的效果。通过定量分析可知,河北省各个地区的区域经济开展水平存在明显基异,可划分为兴旺地区、较高兴旺地区、中等兴旺地区和欠兴旺地区4个层次,各地区间经济开展差距较大。区域经济开展具有不平衡的规律,在一定时期内,地区间存在一定的区域差异是正常的,但是如果差距过大,不重视地区协调开展,那么会出现两极分化,不利于地区经济的持续健康稳定开展。为实现河北省经济的持续健康开展,必须逐步缩小区域经济开展水平之间的差距,充分发挥各个区域的优势,实现地区经济的协调开展。(1)完善区域协调开展的政策体系,明确政策导向。重视欠兴
19、旺地区的经济开展,采取-定政策措施,如加大对不兴旺地区的根底设旅建设的资金投入等。把推进根本公共效劳均等化作为区域协调的政策导向,在改善欠兴旺地区居民根本生活条件的同时,为招商引资创造良好的环境。(2)发挥区域优势,开展特色经济。由于各地在资源禀赋等方面各不相同,可以根据各个地区的特点,发挥优势,开展特色产业,加强区域之间的分工与合作。如唐山、邯郸等地煤、铁等矿产资源丰寓,那么有开展煤炭、钢铁产业的优势,而承德、张家口等地区矿产资源缺乏,但是地处广阔的坝上草原,可以开展生态畜牧业和旅游,通过开展特色产业等以增强区域自身的竞争力。3)把表达效率的市场机制与表达公平的政府干预机制两者结合起来调节经
20、济的开展。加强区域规划,促进各区域、各部门规划的协调,充分发挥规划对区域开展的引领作用。区域经济协调开展并不等同于完全均衡开展,本着效率优先,兼顾公平的原那么,优先开展一些地区,然后以这些地区为龙头带动其他地区的开展。参考文献黄贤金.区域循环经济开展评价M).北京:社会科学文献出版社,2006:181183.何晓群.多元统计分析M)北京:中国人民大学出版社曹光芒,齐建国循环经济的技术经济范式与政策研究J.数量经济技术经济研究,2006,23(5):112121.贾凤亭,梁晓俐地区经济开展水平的统计分析UL辽宁工程技术大学学报,2002,中国财政厅.中国统计年鉴(2023)M.中国:中国年鉴社,
21、2023.附表:地区居民消费总指数地区生产总值亿元)地区生产总指数各地区人均GDP(元)人均口生活用水量升)污水排放量(吨)财政性教育经费支出(万元)北京105.635916251.93108.180394172.621454695136580天津104.851511307.28116.486496128.867146.942270774河北105.696124515.7611L333719124.45278551.35647497山西105.212911237.5511330802111,421161323529544内蒙古105.580914359.88114.35666694.48100
22、3893584765辽宁105.165522226.7112.250349126.162322474834720吉林105.245710568.83113.837870113.33116162.42747077黑龙江105.82912582112.332637128.021506613183150上海105.177219195.69108.282560183.57214155.14407376江苏105.329749110.27Ill61022212.26592773.89234608浙江105.383432318.8510958791196.3420233.97336561安徽105.562
23、515300.65113.525395168.99243265.24488332福建105.263217560,18112.347433188.18316177.53913350江西105.249311702.82525988174.79194431.63175331山东105.020245361,85110.946976129.794433318029725河南105.62752693L03111.928716108.59378784.86800265湖北105.759319632.26113.834233213.18293063.53838175湖南105.527919669.56112.
24、829893203.16278811.44585048广东105+32153210.2811050500241.38785586.510440230广西105.904811720.87112.325449241.94222438.93990786海南106.06572522.6611229012249.235725.151133239重庆105.302610011.37116.431705145.43131449.82893208四川105.339921026.6811526147191.712798526816497贵州105.14675701.8411516117142.7977927.2
25、3139157云南104.8558893+12J13.719038124,89147523.14480463西藏104.9942605.83112.720232228.14634.581641638.4陕西105.703312512.3113.933197163.25121814.73766663甘肃105.86745020.37112.519628146.4659231.692648616青海106.13841670.44113.528827196.9821291.52985919.2宇夏106.33822102.21112.132692163.1439432.37843802.4新疆105
26、.94926610.0511230257160.0683328.543256626地区空气质量到达及好于二级的天数(天)第一产业人均元)第二产业人均元)第三产业人均(元)人均财政收入元)人均进出口总额(美元)北京286665.545715888.7U1.59E+0810839.5316030.2天津3201042.34732492.OU3.25E+0812670.596848.545河北320291L14612558.911.26E081351.552549,6995山西308886.778112505.921.25E+082192.612421.8716内蒙古3473757.16717692
27、.751.77E+082690.969370.0559辽宁3323017.38117409.291.74E+083142.7581678.795吉林3453352.96311209.331.12E+081546.452487.9535黑龙江3172847.3211414.121.L4E+081512.157598.6562上海337592.16133029,243.3E+0839898.8917062.39江苏3172735.44421706.152.17E+089261.0665109.658浙江3332139.51222617,K32.26E+083775.5864123.228安徽303
28、2311.4596743.847674384682161.445333.0936福建3603212.40315027.111.5E+084207.8522353.522江西3472409.9557761.()776109091856.795309.4984山东3203188.54218798.11.88E+082078.051679.352河南3182819.81111112.441.11E+081070.209185.8972湖北3063116.7928691.315869131501244.703360.1296湖南3413146.3957732.1773210031132.759196.
29、9567J-东3602064.36519281.891.93E+083468.1487161.484广西3513018.8956307.6630759971077.035274.9541海南3655124.2395086.651508665111697.8921232.34重庆3242026.778570.87857087004544.497335.372四川3222907.5337114.893711489311280.044270.8071贵+I3491444.3713713,371397311778.48788.85763973云南3652247.2825395.312539531151350.649211.3西藏3642108.3624033.454033449513464.92266.7003陕西3052003.50910212.871.02E+082935.566221.3894甘肃2Wl1761.7965599.049559904871792.009231.8702青海3161905.7769555.957955595671292.419124.2726宁夏333194L7489405.G940517801537.217304.5227新疆2763243.0789792.304979230411694,511042.553