《《计算机视觉》教学大纲.docx》由会员分享,可在线阅读,更多相关《《计算机视觉》教学大纲.docx(9页珍藏版)》请在课桌文档上搜索。
1、计算机视觉教学大纲适用范困:2O2X版本科人才培养方案涕程代码:22140221课程性质:专业必修课程学分:4学分学时:N学时(理论48学时,实舱16学时)先修课程:人工智能导论、人工智能与数学、人工智能程序设计等后接课程:模式识别与计算机视觉、深度学习与应用、机器学习适用专业:人工智能专业开课单位:智能工程学院一、课程说明4计笄机视觉是人工智能夕业的一门专业必脩课。本课程主要研究如何使机器“看”的科学,是使计能机具有像人一样的视觉能力,从而能助识别和理解图像、视频以及三维场景中的物体,通过本课程的学习使学生掌握计算机觇觉的明本原理和技术,图像处理和分析的基本方法,并能膨应用于实际场景中解决实
2、际问逆-学习深度学习和机器学习在计算机视觉中的应用,并能蝮自主开发计算机视觉的应用程序或系统.同时.也在培养学生的创新能力和实践能力,以适应不断发展的计算机视觉领域.为以后从事模式识别与智能捽制、自动驾帔、机器人技术、医疗诊断、安全雅控、却能制造等领域的研究与开发工作打卜扎实的培础。二、课程目标辿过本课程的学习,使学生达到如下目标:课程目标1:了解计驾机视觉的起源.计算机视觉技术的应用现状:了解色彩学基本摄念掌旌图像的数字化表示:理解图像预处理的原因,掌握图像灰度化、图像变换、图像增强等基本算法与原理:了解图像特征提取的基本原理,常视局部特征点检测和边缘检测的后木方法,并可以根据实际应用场景选
3、杼适合的特征提取方法;课程H标2:了解深度学习与神经同络,掌担施于程积神经网络和循环神经网络的图像分类、目标检测与图像分割:了解对抗网络(GAN)的僚埋,掌握对抗网络在图像生成、图像增强、图像修复、图像风格迁移等方面的应用:了解深度学习在语义分割、人脸识别、情感分析、自动与驶、行为分析、智能视版监捽等新兴视觉技术额域的应用.课程目标3:招助学生养成严通的科研思维,树立追求真理,勇于探索的精神I;提高其贡任担当意识,塑造社会主义核心价伯观,为更好的服务社会、建设国宓贡献力;也课程目标4:培养学生树立.正确科学的世界观、人生观和价值观,坚定正确的政治方向.培养学生的法治观念、社会贵任感和创新意识树
4、立正确的审美观念和劳动观念。三、课程目标与毕业要求计分机视觉课程教学目标对人工智能专业毕业要求的支撑见表E表1课程教学目标与毕业要求关系毕业要求指标点课程目标支撑1.工程知火,能好将数学、自然科学、工程基础和专业知识用于解决人工智能及相关应用领域IX杂工程问卷,1.2系统学握人工智能及相关应用额域的工程基础和专业知识,包拈算法、硬件、软件平台及系统等,了解解决工程何即的基本方法.课程目标1:了解计算机视觉的起源,计算机视觉技术的应用现状:了解色彩学基本概念,掌握图像的数字化表示:理解图像模处理的原因,掌握图像灰度化、图像变换、图像增强等填本比法晚理;广解图像特征提取的特本原理,掌握局部特征点检
5、测和边缘检测的基本方法,并可以根据实际应用场景选择适合的特征提取方法,H3.设计/开发解决方案,能设计针对人工智能视觉应用领域工程同明的解决方案和满足特定箫求,并在设计中体现创新意识,考虑社会、环境、健康、安全、法律、文化等因素。3.2设计针对人工智能视觉灾杂工程问遨的解决方案,包括设计或开发满足特定需求和约束条件的软硬件系统、模块或算法流程,并能修进行模块系统级优化,课程目标2:理解传统的视觉算法,熟悉并掌握以下常用的网络:1.exNe1.:VGGNet:Goo1.eNet等.H4.研究I能基于科学原理并采用科学方法对人工智能及相关应用领域的纪杂工程问JE进行研究,包括系统的蛆成研究、算法的
6、研究、参数的优化.并通过信息媒合得到合理行效的结论.1.2能够构建模拟或实蛤系统,通过信息综合分析和实验结果解择,说明其有效性、合理性,得到解决方案实施质量的合理有效结论。课程目标2:了解深度学习与神经网络,掌握域于卷机神经网络和船环神经网络的图像分类、目标检测与图像分割:了解对抗网络(GAN)的原埋,掌握对抗网络在图像生成、图像增强、图像修复、图像风格迁移等方面的应用;了解深度学习在语义分布J、人脸识别、情感分析、自动驾驶、行为分析、智能视频监控等新兴视觉技术领域的应用,H注:表中“H(高)、M(中)-表示课程与相关毕业要求的关联度.四、教学内容、基本要求与学时分配1 .理论部分见表2I教学
7、内容1.计算机视觉引论11.1计算机视觉简史d4干C。、35个次不刁十TTI教学要求,收学点魔点理论学时实验学时对应的课程目标教学要求:了解计算机视觉的基本微念、计算21、21.2 计算机视觉的应用1.3 基于卷枳神经网络的计驾机视觉的应用思政元素:社会主义核心价值观培育机视觉的发展历程,包括早期的视觉系统框架和近年的深度学习方法:了解计算机视觉的主要任务,如图像分类、目标检测.图像识别等:了解计算机视觉的研究现状以及应用领域。点:计算机视觉的主要任务,如图像分类、目标检测、图像识别等:难点I计算机视觉系统框架和深发学习方法.2图像的表示2.1色彩学基础2.2图像的数字化2.3图像的预处理思政
8、元素:赤子情怀教育教学要求Ir翎:基色的原印与彩色模型,掌握照明对成像的影晌:了解图像的采样与量化,,提图像的噪声与像素间的关系:掌柜图像的灰度化与几何变换:掌握图像墙强技术,能够根据具体情况进行图像增强处理.点:图像的果样与fit化,灰度化、几何变换与图像增强.难点t图像增强技术,能师根据具体情况进行图像增强处理41、23.特征提取1.1 1局部特征点概述1.2 角点检测1.3 斑点检测1.4 1特征描述子1.5 边绿检浏1.6 基于窗口模板的检测方法教学要求:J解图像局部特征表达,掌握角点、焦点和艇于特征描述子的检测方法:了解图像边缘含义,掌娓基于一阶/二阶的微分边缘算子检测方法和基于床楼
9、,欧版的检测方法.点:掌握灼部特征点检测和边缘检测的方法,能利用相关方法进行图像边域检测.难点:能采用合适的方法进行图像边缘检测6K24神妙网络1. 1神经网络基础1.2感知器4.3前向传播和反向传播以法44卷积神羟网络结构4.5卷积神经网络的应用1.6循环神经网络结构4.7循环神经网络的扩展与改选思政元素,创新精神价值观名教学要求,了解什么是神经元、卷积计算与网络结构,埋解感知密与激活函数:掌握前向传播与反向传播算法原理与推导过程:了解什么是卷积神经网络,掌握卷枳神经网络的机构与姐成:理解什么是循环神经网络.掌提衡环神经同络的结构与扩展改进以及在如何处埋序列化数据.点:卷枳神经网络和循环神经
10、网络的现成及应用点:卷积神经网络和循环神经网络的工作原理,搭建深度神经网络结构102、35.物体的分类与识别5.1 图像分类与识别5.2 A1.exNe1.网络5.3 VGGNet网络5.4 Goo1.oNet网络教学要求:理解图像分类与图像识别及I1.标检测的区别:了解典型的神经网络架构,掌握AIeXNe1、VGGNet,GoO1.eNe3ResNet网络的原理与搭建。102、35.5ResNet网络56基于神经网络的图像分类与识别MAt搭建AIeXNe1、VGGNeaGoo1.eNct,RCSNe1.网络。难点t利用A1.eXNe1、YGGNeI、Goo1.eNet.ResNet网络实现图
11、像分类、检测与分割.&目标检与语义分割6.1 目标检测与谙义分割6.2 KCNN到FasterR-CNN网络6.3 4到蝎方法:YO法、SSD网络6.4 从FCN到MaskR-CNN网络6.5%于神经网络的目标检测与语义分割敢学要求,理解图像中目标检测与图像分割及谱义分割的区别:拿旌RCNN,PasterR-CNN、YO1.O、SSD,FCN、MaSkR-CNN等网络的原理与搭建,点t搭建RCNN、FasterR-CNN,YO1.O,SSD、FCN、MaSkRCNN网络.难点:利用RCNN,FasterR-CNN,YO1.O,SSD、FCN,MaskR-CNN网络实现目标检测与语义分割。42,
12、37.图片描述与关系识别1 .1单词、句子在深度学习模型中的表示。7 .2Encoder-Decoder模型7.3基于EncoderDecoder的图片描述与关系识别模型教学要求:r解单词、句子在深度学习中的表示,掌握图片描述与关系识别的任务:理解Encoder-Dccodcr基本结构与注意力机制,掌握基于EnCOde1.DeCoder的图片描述与关系识别模型.点:EnCoder-Decoder的图片描述方法.摩点:使用EnCodCr-DCCo埋论介绍1.2 生成时抗网络(GANs)模型1.3 生成对抗网络(GANs)的应用校学要求Ir解生成对抗网络(GANs)原理、模型架构:掌握GANs的运
13、行原理以及能利用GANS实现文本转图像、照片风格转化、局部变附脸和定制图片生成:点:掌押.GAXs的运行原理以及能利用GANS实现文本转图像、照片风格转化、局部变彘脸和定制图片生成,难点:GANS的模型架构与运行原理.42、3、49.基于深度学习的新兴钱竟应用1.1 1三维空间重建1.2 视频检定1.3 目标检测与跟踪思政元素;爱国主义价值观会教学央求,了解三维空间建技术,掌握3D-R2N2进行三维空间重建的算法原理:理解视领稳定的主要任务与康理,掌担通过Mobi1.eNe1.-SSD深度神经网络模型实现人脸检测.维承1.I视频稳定算法,基于OpcnCV框架实现入脸觇菽稳定;理解目标跟踪的追咬
14、任务与原理,掌握目标跟踪的主要方法与技能.重点:掌樨使用深度神经网络模型42、3、4和稔定算法实现人脸视频稳定;掌握H标跟踪的主要方法与技能。摩点:使用UA-DETRAC训练Yo1.OY3Tiny模型,结合DeCPSORT模型实现目标检测跟踪和计数.482 .实验部分实验部分的教学内容、基本要求与学时分配见表3。表3实险项目、实险内容与学时上机项目上机内容和央求上机学时对应的爆程目标1.图像预处理上机内容:使用OPenCV时图像进行图像增强、图像变换.上机要求I对所采集的图像进行预处卉,要求改进港波和图像增强算法.编写程序.最终提高图像鲂戕,实现图像变换.21、22.边缘检测上机内容I使用OP
15、CnCV中的Canny函数实现边缘检测:使用OpCnCV中的Sobe1.函数实现边绿检测.J求:通过实骁掌握图像的Canny边统检测的原理和编程实现方法:通过实验掌握图像的SObe1.边绿检测的原理和编程实现方法.2k23.图像分类上机内容I自己网络居取5个类别(单果、香蕉、菊15、橙子、梨)图片,构建测试与训练数据,学习卷积神经网络图像分类算法.上机要求:首先为瞠取图片进行图像预处理,将其中10%作为测试数据,98作为训练数据,然后深入分析办法,编写程序,实现图像分类.4K34.图俅目标检测与图像分割上机内容I学习图像目标检测与图像分割其法.上机要求,深入分析算法,姆写基于YO1.OE1.法
16、对已经过预处理的图像进行目标检测.编写基于RYNN算法对进行图像分割,提取出目标图像的有效特征,41、3、45.图片描述与关系识别上机内容:幅观给定的百度图片生成一段描述文字。上机J1.求I自己搭建神经网络结构,训练数据集.对给定的图像进行图像描述.其中对于图像描述的任务.神经网络不仅要了解图中有哪些对象,对象之间的关系,还要使用自然语言来描述这些对象的关系22.3.46.GANs照片风格转化上机内容:绐定张给人图像和样式图像.输出新的风格图像上机要求:自己搭建神经网络,给定一张输入图像和样式图像,输出张既有原始内容22、3又有新样式的新图像t-16五、教学方法及手段本课程以课堂讲授为主,结合
17、案例讨论、实验、作业、备课、雨课堂等视颜资源等教学手段完成课程教学任务和相关能力的培养.在理解计尊机视觉原理、图像特征提取和特征识别、图像分割和深度学习舞法基础上,在实际场景中,能的自主开发基于深度学习的图像分类识别项目和图像描述项目的应用程序或系统。在实验教学环节中,通过后发式教学、讨论大教学培养学生计算机视觉应用的基本理论、基本知识和基本技能.培养学生自主学习能力、实际动手能力,激发学生的创新思维.六、课程资源库年门课程用推荐优秀专著3本以上(不包括教材),本学科国内或国际权或期刊S种以上(至少包括外文期刊1种),网络资源2项以上。1 .推荐教材:双错编著计算机视觉IM,北京邮电大学出板社
18、,2020年1月第I版2 .参考书:作者但者).书名.出版社.出版时间.3)印柳罕默德埃尔根迪深度学习计停机视觉IMI.北京:清华大学出版社,2022(2) M域OpenCV计算机视觉翦础教程Py(hon)(MJ北京:人民邮电出版社,2021(3) IM1.卡斯特恩斯蒂格,马克乌斯乌尔里克,克里斯琴威/咙著,计算机视觉算法与应用|M|匕京:清华大学出版社,2019(4)陈仲怙.影凌西.深度学习原理与实践M.北京:人民由口电出版社,2018(5)张铮,薛桂香,顾泽苍.数字图像处理与机器视觉M.北京,人民邮电出版社.2020(6)朱光明.冯明涛,王波.智能视觉技术及应用IA1.1.西安:光电子科技
19、大学出版社,版别(2021年7月)4.网络资源:网站名,访问路径或者:作者.文题.更新和修改11期,访问路径.(1.)hup:/www.maihs.1.th.se/maiemaiikkh/PerSonaIZandersp/瑞典隘德大学数学系视觉If1.(2) hup:“www.cs.bcrkc1.cy.cdu/-dar加州大学伯克利分校Da,idA.Forsyth(3) http:/www.cs.cmu.cdwx9090x8080x7070x60x60课依表现12.5笔记完整,积极参与教学活动,踊跃回答问题,准确率大于90%.簿记完整,认真参与教学活动,回答问题准确率大于80%。笔记不完整,偶
20、尔参与教学活动,回答何题准确率大T70%.上课不认真,上课不记笔记,偶尔参与教学活动.上课不认直,上课不记第记,不参与教学活动.作业37.5作业完整.思路清晰,准确率大于90%,字迹工整。作业完整,准确率大于80%,字进工整,不交作业2次以内,准确率大于70%.不交作业3次以内准确率大于60%.不交作业4次以上,准确率小于60%.实段50实验原理清蜥、绘图规范,实验操作过程熟练、规范、正确,数据处理及讨论正确,实验原理较清晰、绘图较规范,实验操作过程较熟练、规范、正确,数据处理及时论较正确.实验原理基本清晰、绘图基本规范,实验操作过程基本熟练、能完成基本操作,数据处理及讨论基本正确。实验原理不够清晰、绘图不够规范需在指导卜完成墙木操作,数据处理及讨论不够正确.无实聆报告,实验操作步骤有误,数据处理及讨论有误