基于BP神经网络的京津冀典型地物分类系统.docx

上传人:夺命阿水 文档编号:920685 上传时间:2024-01-16 格式:DOCX 页数:31 大小:400.71KB
返回 下载 相关 举报
基于BP神经网络的京津冀典型地物分类系统.docx_第1页
第1页 / 共31页
基于BP神经网络的京津冀典型地物分类系统.docx_第2页
第2页 / 共31页
基于BP神经网络的京津冀典型地物分类系统.docx_第3页
第3页 / 共31页
基于BP神经网络的京津冀典型地物分类系统.docx_第4页
第4页 / 共31页
基于BP神经网络的京津冀典型地物分类系统.docx_第5页
第5页 / 共31页
点击查看更多>>
资源描述

《基于BP神经网络的京津冀典型地物分类系统.docx》由会员分享,可在线阅读,更多相关《基于BP神经网络的京津冀典型地物分类系统.docx(31页珍藏版)》请在课桌文档上搜索。

1、地物分类对城市规划和资源管理至关重要,但是传统统计方法进行的遥感影像分类存在“同物异谱”或者“异物同谱”的问题,为了使遥感影像分类高效、准确,本文通过构建一个基于BP神经网络的分类模型,对京津冀地区的典型地物数据集进行分类研究。研究过程中首先对京津冀地区landsat8OLl遥感影像数据进行了辐射定标、大气校正、图像融合,对京津冀遥感影像数据集进行光谱特征和纹理特征提取,将地物划分为耕地、建筑物、水体道路、林地、裸地,并创建标签数据集,并将数据集以7:3的比例划分为训练集和测试集作为本研究的数据集,搭建并初始化BP神经网络分类模型进行分类。为了最小化分类误差,本研究使用梯度下降法与自适应学习率

2、相结合的方法优化BP神经网络,并对结果进行混淆矩阵运算。最后,使用搭建成功的模型进行京津冀地区的分类,并进行可视化界面的开发与展示。为了更好的评估本模型的性能,将BP神经网络京津冀地物分类模型进行混淆矩阵的计算发现模型分类准确率为79%,对选取的典型地物耕地、建筑物、水体、道路、林地、裸地的分类准确率分别为72%、90%、94%、71%、73%,对比传统监督分类中的最小距离准确率69%和最大似然分类结果准确率76%,发现BP神经网络模型在京津冀地区典型地物分类的任务中表现出较好的性能,且对于水体、建筑物有较好的分类效果。本研究的分类结果对于解决京津冀地区的地物分类问题具有重要意义,可以为京津冀

3、城市规划和资源管理提供精确的信息,有助于决策制定和资源分配,为进一步改进和优化相关技术提供了有益的参考。关键字:BP神经网络地物分类京津冀地区模型评估AbstractContentclassificationisveryimportanttourbanplanningandresourcemanagement,butthetraditionalstatisticalmethodofremotesensingimageclassificationisspectrum,orforeignbodyspectrumproblem,inordertomaketheremotesensingimagecl

4、assificationefficientandaccurate,thispaperbybuildingaclassificationmodelbasedonBPneuralnetwork,classificationresearchoftypicalfeaturesdatasetofBcijing-Tianjin-Hebeiregion.IntheprocessofresearchontheBeijing-Tianjin-Hebeiregionlandsat8OLIremotesensingimagedataradiationcalibration,atmosphericcorrection

5、,imagefusionandofBeijing-Tianjin-Hebeiremotesensingimagedatasetspectralfeaturesandtexturefeatureextraction,thefeaturesintocultivatedland,buildings,waterroad,forestland,bareland,andcreatelabels,datasetandtrainingsetandtestsetas7:3ratio,setupandinitializeBPneuralnetworkclassificationmodelforclassifica

6、tion.Tominimizetheclassificationerror,thisstudyusedthecombinationofthegradientdescentmethodwiththeadaptivelearningratetooptimizetheBPneuralnetworkandperformtheconfusionmatrixoperationontheresults.Finally,thesuccessfulmodelwasusedtoclassifytheBeijing-Tianjin-Hebeiregion,andthevisualizationinterfacewa

7、sdevelopedanddisplayed.Inordertobetterevaluatetheperformanceofthemodel,theBPneuralnetworkofBeijing-Tianjin-Hebeifeaturesclassificationmodelcalculationconfusionmatrixfoundmodelclassificationaccuracyof79%,toselecttypicalfeaturesofland,buildings,water,roads,woodland,bareland,72%,90%,94%,71%,73%,compare

8、dwiththetraditionalsupervisionclassificationoftheminimumdistanceaccuracyof69%andmaximumlikelihoodclassificationaccuracyof76%,foundthatBPneuralnetworkmodelintheBeijing-Tianjin-Hebeiregiontypicalfeaturesclassificationtaskshowedgoodperformance,andforhasagoodclassificationeffectofwaterandbuildings.Thecl

9、assificationresultsofthisstudyareofgreatsignificanceforsolvingthelandclassificationproblemintheBeijing-Tianjin-Hebeiregion,andcanprovidepreciseinformationforurbanplanningandresourcemanagementintheBeijing-Tianjin-Hebeiregion,contributetodecisionmakingandresourceallocation,andprovideausefulreferencefo

10、rfurtherimprovementandoptimizationofrelatedtechnologies.Keywords:BPneuralnetworkClassificationofearthobjectsBeijing-Tianjin-HebeiregionModelevaluation摘要IAbstractII第1章绪论11.1 研究背景及意义11.2 国内外研究现状I1.3 本文贡献21.4 论文结构3第2章研究区和研究方法42.1 研窕区介绍42.2 技术路线42.3 数据预处理42.3.1 辐射定标和大气校正62.3.2 图像融合和裁剪72.4 特征提取92.5 本章小结1

11、0第3章软件设计113.1 软件开发环境113.2 软件功能113.3 软件测试133.4 本章小结14第4章模型构建与优化154.18 P神经网络介绍151.1.1 BP神经网络理论及结构151.1.2 BP神经网络优势151.1.3 数学推导164.2 BP网络结构及参数设置174.3 BP网络优化184.3.1 梯度下降法184.3.2 自适应学习率法194.4 本章小结20第5章分类结果与分析215.1 训练结果分析215.2 分类结果分析215.3 本章小结23第6章结论和展望256.1 研究成果总结256.2 展望25致谢2627参考文献第1章绪论1.1 研究背景及意义遥感技术是一

12、项依靠电磁波完成地物探测的技术手段,不段增长的人口危机和环境破坏问题也成为人类可持续发展道路的一大难题,这也人们对地球资源环境的探索也不断深入,人们必须通过技术手段来获取地球能源信息。而现在,计算机技术和空间技术的发展,人类航天技术和卫星技术的不断进步,人们能够获取到的关于地球的遥感影像数据越来越多,越来越丰富,如何处理这些急剧增长的数据量也成为难点。遥感影像的分类是遥感技术应用中的重要一环,是研究地区发展和地理信息的重要参考技术,对于地图测绘、目标识别、军事领域都具有重要研究价值和意义。但是,采用传统的遥感影像分类方法进行分类的遥感影像仍然存在许多的问题,“同物异谱”和“异物同谱”的问题层出

13、不穷。同时.,随着遥感数据获取手段的加强,需要处理的遥感信息量急剧增加,使得遥感影像分类的过程更加艰难。近几十年,随着我国遥感工作者持续不断的努力,中国的遥感技术已经取得了世界级的成果。遥感技术的飞速发展和遥感影像数据的规模化也使得遥感技术被广泛应用于国民经济发展的各个方面,如土地资源调查和管理、农作物估产、地质勘查、海洋环境监测、灾害监测、全球变化研究等,形成了适合中国国情的技术发展和应用推广模式。20世纪以来,国内外工作者不断改进遥感影像分类方法,将其与神经网络、机器学习相结合,探索创造出了许多更加高效、准确的遥感影像分类方法,这也成为推动遥感分类技术发展的巨大动力。人工神经网络作为一种强

14、大的机器学习算法,在模式识别和分类任务中具有广泛应用131O本文的研究正是基于人工神经网络中的BP神经网络,旨在解决京津冀地区典型地物分类问题。通过本次研究,可以提高京津冀地区典型地物分类的准确性,为相关领域的决策提供准确的基础数据支持。1.2 国内外研究现状人工神经网络是模拟人类审题头脑和神经网络组织进行抽象思考和仿真,对数据进行处理的模式,1943年由心理学家WarrenMcCulloch和数理逻辑学家WalterPitts提出的MP模型(单层感知网络)做为最初的神经网络,为人工神经网络的发展奠定了基础产。但是随着人们对人工神经网络的深入研究,人们发现它存无法处理非线性问题的不足。解决非线

15、性问题的唯一途径是采用多层前馈网络,即在输入层和输出层之间加上隐含层,构成多层前馈感知器网络。1986年由Rumelhart和McClelland为首的科学家提出的BP(BackProPagation)神经网络概念,是一种按照误差逆向传播算法训练的多层前馈神经网络,具有任意复杂的模式分类能力和优良的多维函数映射能力,解决了简单感知器不能解决的异或(EXCklSiVeOR,XoR)和一些其他问题,解决了多层神经网络隐含层连接权学习问题,并在数学上给出了完整推导。人们把采用这种算法进行误差校正的多层前馈网络称为BP网络,BP网络常应用于模式识别,回归预测等,是应用最广泛的神经网络模型之一。1992

16、年,人工神经网络被KanenoPOUlOS应用于SPoT图像分类,将其分类了20个对象并将分类的结果与其他方法进行比较,证实人工神经网络应用于图像分类具有良好的效果,2001年J.Zhang使用神经网络对进行郊区土地覆盖检测并表明了其优于传统统计方法;2010年Gonzalo等人将纹理特征与Hopfiled神经网络结合进行分类,分类精度达到89%近几十年来,在我国,人工神经网络在图像识别,土地分类等领域取得了显著的成果,2000年贾永红将人工神经网络应用于多源遥感影像分类中,证实了人工神经网络在遥感影像分类中的良好效果.;2007年,赵泉华,宋伟基等人提出分形纹理的BP神经网络遥感影像分类,同

17、样取得较好的结果,20016年曹兆伟等人对海岛地区遥感影像进行神经网络分类,并与非监督分类及最大似然、最小距离的分类结果比较“叫发现优于这两种算法。我国研究人员对于BP神经网络的学习和发展以及其在遥感影像分类领域的探索有着强烈的追求,这也促使BP神经网络在遥感领域的应用越来越广泛,更大大推动了我国遥感技术的发展及应用。本研究的旨在使用BP神经网络完成BP神经网络模型搭建,并运用模型为京津冀遥感影像进行分类,研究结果可以为京津冀地区的城市规划和资源管理提供科学支持:地物分类对于城市规划、资源管理和环境保护等领域具有重要意义1.3 本文贡献本研究采用了BP神经网络对京津冀地区进行典型的地物分类,对

18、获取的遥感影像进行预处理过程和特征提取,制作标签样本,与传统的BP神经网络分类相比,本文在对BP神经网络的参数传递过程中增加了梯度下降和自适应学习率的方法来减小误差,与监督分类中的最大似然分类方法和最小距离分类方法进行对比,得到了BP神经网络算法较两种分类方法相比具有明显优势的结论,并使用构建的BP神经网络分类模型完成了对京津冀遥感影像的分类。本研究的分类结果为京津冀地区的城市规划和资源管理提供科学支持:地物分类对于城市规划、资源管理和环境保护等领域具有重要意义。证实了BP神经网络遥感影像分类是一种高效准确的地物分类方法,为京津冀地区的城市规划和资源管理决策提供科学支持,帮助准确获取和利用地物

19、信息。同时,这些分类结果可以为土地利用规划提供重要的数据支持,帮助决策者了解不同地区的土地利用状况,制定合理的土地利用政策和规划。BP神经网络对遥感影像进行分类,识别和监测城市扩张过程中的建设用地变化有助于及时掌握城市扩张的情况,为城市规划和土地资源管理提供科学依据。1.4 论文结构第一章是论文的绪论,阐述了本论文研究工作的背景、实际价值以及国际国内的研究成果,详细说明本论文的研究目标与内容。第二章介绍了京津冀研究区的特点,并进行了影像分类处理工作之前的预处理。一般涵盖辐射定标、大气校正、辐射校正、影像融合以及图像裁剪,为之后的分类处理提供数据信息支持。第三章是通过PyQt5和Qldesign

20、进行软件的设计与搭建,完成BP神经网络分类系统的可视化过程,借助图形手段清晰的传达出分类的信息。第四章总体解释了BP神经网络的算法原理以及特征,同时具体说明文章里选择的BP网络算法的相关理论、算法机理以及使用梯度下降和自适应学习率对BP模型参数进行优化,为之后的论述提供理论支持。第五章是对上述分类结果的分析与总结获得最后的结果,对分类结果制图,同时对其结果予以检验与分析,将BP神经网络分类器与非监督分类方法和最小距离分类进行对照,最后获得有关BP神经网络优势的实际结论。第六章是结论,总结本文的研究内容,并对该项研究的未来进行展望。第2章研究区和研究方法2.1研究区介绍京津冀研究区,也被称为京津

21、冀协同发展区或北京天津-河北协同发展区,是中国境内一个重要的经济区域,位于华北地区。该区域由北京市、天津市和河北省的部分地区组成,面积约为21.1万平方公里。京津冀研究区地貌复杂多样。北部的北京市和天津市主要是平原地区,地势相对较为平坦。南部的河北省则包括了平原、丘陵、山地等多种地貌类型,如河北平原、太行山脉等。京津冀地区是中国重要的粮食生产基地之一,农田面积较大;该地区有一定面积的森林和林地;京津冀地区有广阔的草地,草地覆盖主要分布在河北省的山区和辽河平原等地;京津冀地区有多条重要的河流,如黄河、海河和津浦水系;随着经济的发展和城市化进程,京津冀地区的城市和人工用地不断扩大。北京和天津是中国

22、重要的城市中心,河北省的大部分地区也呈现出城市化快速发展的趋势,如图2-1为本研究的研究区域京津冀地区。图2T京津冀研究区2.2技术路线本研究主要的研究内容和技术路线如图2-2所示,首先获取影像数据进行预处理,在将影像进行特征提取,制作带标签的数据集并划分训练集和测试集,初始化网络结构和参数,使用训练集进行网络的训练,并在迭代的过程中完成优化和参数的更新直到得到较好精度模型并输出模型U3,最后对分类结果进行精度验证。图2-2技术路线2.3数据预处理本论文研究的是京津冀地区的典型地物,本次研究采用Iandsat8OLI数据卫星数据产品,数据时间为2021年3月份至5月份,应用数据为北京、天津、河

23、北三个地区影像;IandSat8的OLl陆地成像仪包括下表所示的9个波段,其原始数据以进行过几何校正,选择2021年3月份至5月份京津冀地区的影像作为研究材料。landsat8OLI传感器数据介绍如表2-1所示。表27landsat8OLl传感器数据说明OLI陆地成像仪ETM+波段名称波段(Um)空间波段名称波段(Um)空间分辨分辨率率(m(m)Band1Coastal0.433-0.45330Band2Blue0.450-0.51530BandlBIue0.450-0.51530Band3Green0.525-0.60030Band2Green0.525-0.60530Band4Red0.6

24、30-0.68030Band3Red0.630-0.69030Band5NIR0.845-0.88530Band4NIR0.775-0.90030Band6SWIRl1.560-1.65130Band5SWlRl1.550-1.75030Band7SWIR22.100-2.30030Band7SWIR22.090-2.35030Band8Pan0.500-0.68015Band8Pan0.520-0.90015Band9Cirrus1.360-1.39030本次研究过程中使用的分类数据通过ENVlRol进行选取并输出,将数据集划分为训练集、测试集两部分,使用训练集数据对搭建的BP神经网络进行训

25、练和学习,使用测试集完成验证,当达到较好的精度或到达迭代次数时,模型搭建成功,使用此模型对获取的京津冀遥感影像进行分类得出分类结果。2. 3.1辐射定标和大气校正辐射定标和大气校正是进行遥感影像分析的首要工作,此次研究为达到完整的研究软件过程,在Python环境下来实现两部分内容。考虑研究所采用到的遥感影像数据较为庞大,通过预处理拼接裁剪的过程进行预处理,本次研究过程中裁剪结束后北京、河北、天津的遥感影像大小分别为6GB、10GB、5GBo辐射定标的过程中反映了遥感传感器接收到的电磁辐射的强度或能量,它是将遥感影像中的数字值(DN,DigitalNumber)转换为辐射值或辐射亮度值的过程,遥

26、感光谱辐射定标时的转换算式为:LsatI=Bias+(GainDN)(2-1)单位:mWcm2ster1mm1其中LSatl为辐射亮度值,BiaS是偏移量,Gain是增益,DN是像元值遥感影像的预处理流程图如图2-3所示那Je诳像做处理图2-3遥感影像预处理流程图由于IandSat80Ll影像已经经过几何校正,本次研究不需再进行,研究过程中使用6S模型技术实现IandsatSOLI数据的大气校正过程,6S模型属于基于物理模型的绝对辐射校正,是利用电磁波在大气中的辐射传输原理搭建的模型对遥感影像大气校正的方法,校正精度较高。6S模型大气校正主要的参数包括几何参数(卫星及太阳的天顶角、方位角)、气

27、溶胶光学厚度、水蒸汽、臭氧、高程等1,在使用Python环境进行6S模型大气校正时,可以直接调用Py6s库(基于Python的6S模型接口)来自动计算和应用6S模型参数,以实现LandsatSOLI影像的大气校正,使用6S模型完成大气校正后的光谱曲线图如图2-4所ZjXo2.3.2图像融合和裁剪图像融合将多光谱影像与全色影像结合在一张影像中,使这张影像具有全色影像较高的分辨率,又可以和多光谱一样可以精细的描述目标光谱,含有更丰富的信息,本次研究通过重写GDAL库中的gdal_pansharpen库完成遥感影像全色影像和多光谱影像的融合过程,图2-5为遥感影像融合前后对比图,可以发现,融合后的遥

28、感影像精度更高,较原来的影像,数据量更大。物持图2-5图像融合前(左图)和图像融合后(右图)此研究采用对融合图像基于ENVI进行裁剪,本次研究是针对京津冀三个区域的研究,因而需要拼接后的遥感影像进行矢量裁剪的操作,将问题聚焦在我们需要研究的三个行政区内,得到裁剪后图像图26所示。裁剪和融合将对大幅影像进行调整,以河北省影像为例,其操作过程可以分为:预处理分块处理-分类处理-拼接,此过程可以保证在内存相对较小的计算机上可以较好的进行影像处理和分类。同时,这种做法会使处理、分类时间大幅度增加,增大处理周期。图2-6裁剪后的天津影像,裁剪后的河北省影像,裁剪后的北京影像通过使用Python进行遥感影

29、像的预处理,对遥感影像进行辐射定标和大气校正,与ENVI处理结果进行对比发现结果无异,证实对遥感影像进行预处理可以通过代码来完成,实现自动化的辐射定标和大气校正过程。在ENVl中进行上述辐射定标、FIaSh快速大气校正,图像融合,输出的影像如图27右图所示,与使用python代码完成的遥感影像进行对比,发现使用python代码完成的遥感影像与在ENVI中完成的结果相同.图2-7在Python中进行预处理的结果(左)在ENVl中进行预处理的结果(右)2.4特征提取特征提取是计算机提取到影像特征性信息的方法及过程,其主要作用是特征降维和提取特征方便后续的机器学习,就是将图像或者事物简化成只有显著特

30、点的一个过程,对于机器学习的识别来讲,如何在图片中将猫识别出来首先就是提取出猫所具有的特征。特征可以理解为数字,在进行计算过程中,数值越大,特征越强烈。针对遥感影像数据的特征提取,地物具有光谱特征、纹理特征、形状特征三大部分。遥感影像的光谱信息反映了地物反射电磁波能量的大小,是进行遥感影像木事判读的重要依据。光谱特征最主要的特点是对应与每个像素,但与像素的排列等空间结构无关,是区分地物类别的本质特征,因而可以根据地物光谱特征进行遥感影像的特征提取。对遥感影像进行光谱特征提取的方法本研究使用ENV进行光谱特征提取,并辅以纹理特征提取,将影像的光谱特征和纹理特征相结合,作为本研究的标签样本数据集,

31、如图2-8为ENVI进行纹理特征的提取。图2-8提取纹理特征计算的样本分离度如表2-2所示,可以看出,每个类别的样本分离度均大于1.8,可以获得较好的分类结果。表2-2训练样本可分离度地物建筑物道路耕地林地水体裸地建筑物道路1.976耕地1.9981.999林地1.9991.9971.995水体1.9991.9991.9992.000裸地1.9991.9991.9991.9971.999依据上述京津冀的地物类型及特点,本研究通过使用ENVI的ROI选取包含建筑物、耕地、林地、裸地、水体、道路在内的6个类别样本,共计3000个左右的样本作为训练数据集;为保证BP神经网络训练的准确性,选取样本数量

32、应保持一致性均匀性,对于本研究的数据,采用7:3的比列将结果分割为训练集和测试集,如下表2-3所示为训练样本和测试样本的数量。表2-3样本选取和数量样本类别训练样本测试样本建筑物358154耕地349150林地352151裸地353152水体357153道路3521522. 5本章小结本章介绍了文章研究的区域为京津冀区域,首先介绍了研究区概况,及使用的数据为landsat8OLl数据,并使用Python进行了遥感影像的辐射定标和大气校正,裁剪出主要研究对象-京津冀研究区,同时进行遥感影像的光谱特征和纹理特征提取,制作出标签样本数据集,将数据集按照7:3划分为训练集和测试集,为下面BP神经网络的

33、搭建和训练提供数据支持。第3章软件设计为了使本次研究的内容更具直观性,在研究中进行了软件的设计与实现,软件的开发环境是python,python作为一种强大的集成开发工具,拥有大量可提供帮助的库函数,使用Qt5Qt和Qtdesign进行软件的界面开发,并使用GDAL与OPenCV对原始影像与预处理的结果进行显示,本次研究提供了强有力的支持。3.1软件开发环境1、软件环境:本研究所采用的软件研究环境为Pythono主要研究框架为Tensorflow2.0-CPU,Numpy,PyTorch,Pyqt5,Qtdesign,GDAL,OpenCV等oTensorflow2.0-CPU,Numpy,P

34、yTorch为基于神经网络的深度学习框架。Pytq5,Qtdesign负责可视化界面的设计与实现。2、硬件环境:CPU:2.6GHZ四核InteICOrei79750;内存:8G3. 2软件功能软件主要功能包括文件,编辑,设置三大模块,软件可以实现的功能是进行影像的加载显示,保存文件,清理窗口,影像的预处理,BP训练,BP分类,退出x.n金做改置加优影像111保文件浦理由UInitialResult图37软件的初始界面groundtfcctIScfWiicfltEfignoundij为连接输入层节点i和隐藏层节点j的权重的为输入层i个节点的输出。对输出层的k个节点,其加权输出Zk和激活输出al

35、,3册表示连接输入层和隐藏层节点的权重,3,表示连接隐藏层和输出层节点的权重,b,)和足)分别是隐藏层和输出层节点的偏置,。表示sigmoid函数,n表示输入层节点数,m表示隐藏层节点数,K表示输出层节点数。葭)=呢)一姆(4-5)城D表示网络输出,y表示样本的真实标签,计算输出误差6即;其次,反向传播的过程是从输出层反馈到到输入层,调整连接权重和偏置的梯度值,以及进行权重的更新过程。=。甘)求屋)碱)(4-6)8E_e(o)a()布k力(4-7)=w(4-8)(4-9)(4-10)其中,。(ZjS)表示sigmoid函数的导数,8,)为反向传播误差,E表示激活函数,6?表示输出层节点误差,6

36、:)表示隐藏层节点误差,a声表示隐藏层节点输出值,K表示输出层的节点数。公式(4-7)、(4-8)(4-9)、(4-10)为计算连接权重和偏置的梯度公式3:)=n6:)(4-11)kj(h)ko(八)3=n,6,x)(4-12)JkJk=n(4-13)b,)=n6j)(4-14)其中,4,表示连接隐藏层和输出层节点的权%更新量,AbW是输出层和隐藏层节点的偏置更新量,n表示学习率。公式(4-11)、(4-12)、(4-13)、(4-14)根据误差和学习率更新连接权重的值的过程。重复以上前向传播、反向传播以及更新梯度和权重的步骤,达到迭代次数或其他终止条件后结束。BP分类的基本步骤,包括输入、前

37、向传播、计算误差、反向传导、计算梯度、权重更新和终止条件,在本次研究中设置的终止条件是BP神经网络的迭代次数,观测所搭建的神经网络在这个迭代次数内所能达到的准确率和损失率是评估网络优劣性的标准之一。4.2BP网络结构及参数设置BP神经网络包括输入层、隐藏层和输出层,每层由多个节点组成,节点间通过权重连接。每个节点承接前一层节点的输入,并对其进行加权求和和激活函数的非线性转换,然后将输出传递到下一层。前向传播:输入训练样本,逐个计算节点,直到达到输出层,这样可以获得网络的预测结果。反向传播:计算出当前输出与真实输出之间的误差,将误差传播回隐藏层和输入层,调整权重,以减小误差。这一过程使用梯度下降

38、算法来更新连接权重,使网络能够逐渐优化并逼近目标函数的最小值。BP神经网络具有学习能力和适应能力,可以通过训练样本集来调整连接权重,从而对新的输入样本进行预测和分类。它广泛应用于数据挖掘、图像处理等领域,是一种强大的机器学习工具。网络结构的设计需要考虑输入数据的特点和分类任务的复杂度。本次研究使用的是7波段遥感影像,即7个维度,隐藏层的神经元数目根据交叉验证的方法进行调整,输出层的神经元数目应该与分类的类别数目相同,本次研究分为6个类别。此研究参数设置包括初始学习率设置:0.03、迭代次数:1500、激活函数:Sigmod0训练和测试数据集的划分为7:3。BP神经网络初始参数设置如表所示表4-

39、1BP神经网络初始参数设置网络模型参数参数描述值n输入层节点数(维数)7mkLearing_rate隐藏层节点数10输出层节点数(类别)6学习率0.03初始权重0jn初始偏置0模型迭代次数1500A:B激活函数Sigmod训练集与数据集划分7:34.3BP网络优化4.3.1 梯度下降法在训练和优化智能系统时,梯度下降是一种最重要的技术和基础现。梯度下降的功能是通过寻找最小值,控制方差,更新模型参数,最终使模型收敛,通过计算网络参数对损失函数的梯度,并沿着梯度的反方向更新网络参数,以最小化损失函数,在每个训练样本上计算梯度并更新参数。相比于传统的批量梯度下降法,随机梯度下降(SGD)的更新速度更

40、快,但可能会引入更多的噪声。图4-3权重更新方向与梯度更新方向相反使用梯度下降及其变体时存在的挑战是很难选择出合适的学习率:学习率太小会导致网络收敛过于缓慢,学习率太大可能会影响收敛,并导致损失函数在最小值上波动,甚至出现梯度发散。相同的学习率并不适用于所有的参数更新。如果训练集数据很稀疏,且特征频率非常不同,则不应该将其全部更新到相同的程度,但是对于很少出现的特征,应使用更大的更新率。在神经网络中,最小化非凸误差函数的另一个关键挑战是避免陷于多个其他局部最小值中。实际上,问题并非源于局部极小值,而是来自鞍点,即一个维度向上倾斜且另一维度向下倾斜的点。这些鞍点通常被相同误差值的平面所包围,这使得随机梯度下降法(SGD)很难脱离出来,因为梯度在所有维度上接近于零。4.3.2 自适应学习率法AdaGrad算法在随机梯度下降法的基础上,根据之前的梯度信息自动调整每个

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 在线阅读 > 生活休闲


备案号:宁ICP备20000045号-1

经营许可证:宁B2-20210002

宁公网安备 64010402000986号