《《机器学习基础及应用》教案第1课搭建机器学习开发环境(一).docx》由会员分享,可在线阅读,更多相关《《机器学习基础及应用》教案第1课搭建机器学习开发环境(一).docx(8页珍藏版)》请在课桌文档上搜索。
1、电工电子技术基础与应用教案课时分配表章序课程内容课时备注1搭建机器学习开发环境42训练线性回归预测模型43使用逻辑回归进行分类24使用k近邻算法实现分类与回归25使用朴素贝叶斯算法训练分类器26使用决策树算法实现分类与回归27使用支持向量机实现图像识别28构建集成学习模型29聚类410使用人工神经网络实现图像识别411真假钞票鉴别2机动232课即搭建机器学习开发环境(一)课时2课时(90min)教学目标知识技能目标:(1)理解机器学习的基本概念(2)了解机器学习的应用领域(3)了解机器学习的类型素质目标:(1)学习机器学习的基础知识,加强对新技术的了解,增强探究意识(2)了解时代新科技,激发学
2、习兴趣和创新思维,增强民族自信心教学重难点教学重点:机器学习的基本概念,机器学习的应用领域,机器学习的类型教学难点:正确认识机器学习教学方法案例分析法、问答法、讨论法、讲授法教学用具电脑、投影仪、多媒体课件、教材教学过程主要教学内容及步骤课前任务【教师】布置课前任务,和学生负责人取得联系,组织学生下载“任务工单一测试电阻的伏安特性”,并根据任务工单进行组内分工,同时提醒同学通过文旌课堂APP或其他学习软件,了解白炽灯的基本工作原理【学生】完成课前任务考勤【教师】使用文旌课堂APP进行签到【学生】班干部报请假人员及原因新课预热【教师】自我介绍,与学生简单互动,介绍课程内容、考核标准等【学生】聆听
3、、互动【教师】讲一些机器学习在生活中的作用的案例随着科技的发展和投入,机器学习在我们的日常生活中发挥着越来越重要的作用。机器学习是人工智能的一种,它使用模式识别,统计推理和计算机算法来解决复杂的问题。它允许计算机从给定的数据中学习,找到最佳答案。因此,机器学习可以用于各种商业和家庭场景,从信用卡欺诈检测到智能家居控制系统,甚至是智能驾驶汽车。近年来,随着互联网技术和智能硬件设备的不断发展,人工智能已经渗透到了人们生活、工作和学习的方方面面。作为人工智能的关键技术,机器学习也就成了一个热门话题。无处不在的数据、计算能力的增强及存储技术的发展,使得机器学习越来越受重视,机器学习技术成为众多行业关注
4、的焦点。小旌也关注到了这一点,想加入机器学习的队伍中。了解到PythOn语言在人工智能、大数据、网络爬虫、系统运维等方面都有着广泛应用,因此,小旌决定使用Python语言进行开发。Python语言具有数量庞大且功能相对完善的标准库和第三方库.通过对这些库的引用,能够实现不同领域业务的开发。然而,由于库的数量庞大,安装、管理这些库,以及对库进行及时升级维护成为一件复杂的事情。因此,找到“已经集成好必要库的Python开发环境”就变得尤为重要。小旌查阅资料发现,Anaconda集成了包含NumPyxSdPyxPandassMatplotlibxScikit-Iearn等机器学习常用库在内的180多
5、个工具包,使用Anaconda可一次性安装Python开发环境及大量的第三方库。于是,小旌决定使用Anaconda来完成机器学习开发环境的搭建。请分析一下机器学习开发环境的搭建的步骤有哪些?【学生】聆听、记录、理解互动导入【教师】要求全班学生以35人为一组进行分组,各组选出组长,组长组织组员扫码观看“人工智能、机器学习与深度学习的关系“和“机器学习的发展历史”视频,并讨论下列问题:问题1:画出人工智能、机器学习与深度学习的关系图。问题2:什么是人工智能?问题3:简述机器学习的发展历程。【学生】扫码观看、思考、分组讨论、回答问题【教师】通过学生的回答引入要讲的知识传授新知【教师】通过学生的回答引
6、入要讲的知识,介绍机器学习的概念与应用领域、机器学习的类型的相关知识1.1 机器学习的概念与应用领域1.1.1 机器学习的概念1.什么是机器学习人们往往会有这样的经历:看到微雨过后的晚霞,就能预测出明天是一个好天气;看到色泽青绿、根蒂蜷缩、敲起来声音浊响的西瓜,就认为是一个好西瓜。这是因为在生活中人们已经遇到过很多类似情况,根据生活经验就可以做出有效判断。那么,计算机呢?是不是也能做出类似的预测呢?机器学习正是这样的一门学科,它致力于研究如何使计算机能够模拟人的学习行为,实现自主获取新知识,并重新组织已有的知识结构,不断提升自身解决问题的能力。机器学习过程与人类通过经验预测未来的过程羽以。【教
7、师】通过多媒体展示“机器学习与人类思考的类比”图片(详见教材),并介绍相关知识人类通过经验归纳出相应规律来解决新问题,而机器学习通过“历史数据”训练出一个模型,运用模型预测新的未知问题。这里的历史数据”对应于人类的经验;模型”对应于人类总结出的规律(即习得的结果);训练”对应于人类通过经验归纳出规律的过程;算法”对应于人类归纳规律时所用的方法.在学术界,机器学习还没有一个公认且准确的定义。目前,认可度比较高的定义有如下两个。(1)亚瑟塞缪尔的定义:机器学习是一个研究领域,让计算机无须进行显著式编程就具备学习能力。什么是显著式编程?举例说明,假如要让计算机识别菊花和玫瑰花,人为地告诉计算机菊花是
8、黄色的,玫瑰花是红色的。那么,计算机看到黄色的花就认为是菊花,看到红色的花就认为是玫瑰花,这样的编程方式就是显著式编程”。但是,如果给计算机一批菊花的图片和一批玫瑰花的图片,然后编写程序,让计算机自己,软结出识别菊花和玫瑰花的规律,再来辨认菊花和玫瑰花。这种让计算机自己总结规律的编程方式是“非显著式编程”。【教师】提出以下问题,随机邀请学生进行回答显著式编程和非显著式编程有什么区别?【学生】聆听、思考、回答【教师】总结学生的回答(2)汤姆米切尔的定义:一个计算机程序被称为可以学习,是指它针对某个任务T和某个性能指标P,能够从经验E中去学习。这种学习的特点是,它在T上的被P所衡量的性能,会随着经
9、验E的增加而提高。在识别菊花和玫瑰花的例子中,任务T就是编写计算机程序识别菊花和玫瑰花;经验E就是给计算机输入一批菊花和玫瑰花的图片;而性能指标P可以认为是能正确识别菊花和玫瑰花的概率。综合分析学者们的描述,机器学习可以这样理解:机器学习(machinelearning,ML)是研究计算机怎样模拟或实现人类的学习行为,以获取新知识或技能的技术,是一门通过编程让计算机从数据中进行学习的科学。2.机器学习的相关术语机器学习过程中的相关术语包含数据相关术语、训练模型相关术语和获得模型后的相关术语。【教师】通过多媒体展示“数据相关术语”图片(详见教材),并介绍相关知识(1)数据相关术语。机器学习的基础
10、是大量的数据,具有相似结构的数据样本集合称为数据集;数据集的每条记录是关于一个事件或对象的描述,称为一个样本或示例;反映事件或对象在某方面的表现或性质的事项,称为特征或属性;属性上的取值称为特征值或属性值;描述样本特征参数的个数称为维数。【教师】提出以下问题,随机邀请学生进行回答以计算机识别图像中的动物是否是狗为例,其数据集、样本、特征、特征值分别是什么呢?【学生】聆听、思考、回答【教师】总结学生的回答(2)训练模型相关术语。从数据中学习得到模型的过程称为训练或学习;训练过程中使用的数据称为训练数据,每个样本称为训练样本,训练样本组成的集合称为训练集;为得到效果最佳的模型,用来调整模型参数的样
11、本称为验证样本,验证样本组成的集合称为验证集。(3)获得模型后的相关术语。使用模型对未知数据进行预测的过程称为测试,用于预测的样本称为测试样本,测试样本组成的集合称为测试集;模型适用于新样本的能力,称为泛化能力。1 .1.2机器学习的应用领域技术的不断进步,使得机器学习的应用领域越来越宽广,应用效果也越来越显著。总体来说,机器学习的应用主要集中在语音识别、计算机视觉、自然语言处理、自动驾驶与大数据分析等领域。2 .语音识别语音识别是让机器理解人说话的声音信号,并将其转换成文字的过程,它是机器学习较早的应用领域。语音识别算法是语音输入法、人机对话系统等应用的关键技术。目前,运用语音识别技术的很多
12、产品已经进入了我们的生活。例如,智能家居中,只要与智能音箱进行简单对话,就能控制家电的开关状态,给人们的生活带来了极大的便利。3 .计算机视觉计算机视觉是研究如何让机器看的科学。目前常用的计算机视觉技术包含人脸识别、指纹识别、车牌识别等。其目的在于使用计算机代替人眼,对目标进行识别、跟踪,以及估计目标的大与距离等。机器学习是计算机视觉的重要基础,计算机视觉的各个环节都需要机器学习算法.例如,目前常用的人脸识别就用到了深度学习中的算法。【教师】提出以下问题,随机邀请学生进行回答计算机视觉与机器视觉的区别有哪些?*【学生】聆听、思考、回答)【教师】总结学生的回答计算机视觉与机器视觉的区别。第一,概
13、念不同.计算机视觉是利用计算机及其辅助设备来模拟人的视觉功能,实现对客观世界三维场景的感知、识别和理解;机器视觉就是用机器代替人眼进行测量和判断。第二,侧重点不同。计算机视觉侧重理论算法的研究,强调理论;而机器视觉侧重工程的应用,强调实时性、高精度和高速度。4 .自然语言处理【教师】通过多媒体展示“自然语言处理”图片(详见教材),并介绍相关知识自然语言姐嘱计算机科学与语言学相结合而产生的一个应用领域,主要研究使用电子计算机模拟人的语言交际过程,使计算机能理解和运用人们生活中使用的自然语言,实现人机之间的自然语言通信,从而进一步实现计算机代替人进行部分脑力劳动的目标。其中,部分脑力劳动主要包括直
14、询资料、解答问题、摘录文献、汇编资料,以及一切与自然语言信息有关的加工处理.自然语言处理通常包括自然语言分析和自然语言生成两方面内容。自然语言分析包括分词方法、命名实体识别、句法分析、语义分析等方面的研究,这些方面的研究都以机器学习技术为基础,如对分词方法的研究会涉及隐马尔可夫模型;自然语言生成是将存储于计算机中的数据转化为人们能够理解的自然语言。【高手点拨】语言的理解和生成是一个极为复杂的解码和编码过程。一个能够理解自然语言的计算机系统看起来就像一个人一样,它不仅能理解上下文知识和信息,还能用信息发生器进行推理。理解和书写语言的计算机系统需要具有表示上下文知识结构的某些人工智能思想,以及根据
15、这些知识进行推理的某些技术。5 .自动驾驶【教师】通过多媒体展示“自动驾驶汽车”图片(详见教材),并介绍相关知识自动驾驶的研究在20世纪80年代就开始了。近几年,自动驾驶汽车获得了飞跃式的发展。奥迪、大众、宝马等传统汽车公司均投入巨资研发自动驾驶汽车,目前已有产品进入市场.2011年6月,美国内华达州通过法案,成为美国第一个认可自动驾驶汽车的州,此后,其他州也相继通过类似法案。自动驾驶汽车有望在不久的将来出现在普通人的生活中,而机器学习技术则起到了司机的作用。6 .大数据分析机器学习与大数据的结合将产生巨大的价值。目前,机器学习技术已经在电子商务、互联网金融、旅游推荐、社交网络分析等众多行业和
16、领域中得到广泛应用.例如,在金融领域,银行可利用机器学习技术,对消费者的刷卡数据进行统计和分类,从而获得消费者的消费习惯、消费能力和消费偏好等具有商业价值的数据信息,向消费者精准推荐各种服务(如理财或信贷服务);电信行业可以借助以机器学习为基础的大数据处理软件,对用户信息进行处理,从而得到能够直询客户信用情况的数据,使得第三方企业可以凭借这些数据信息制订市场分析报告或对目标客户群体的行为轨迹进行分析.【教师】要求学生分组讨论,随机邀请学生进行回答请直阅相关资料,然后分组讨论机器学习现有的其他应用领域,并畅想机器学习未来的发展。【学生】聆听、思考、回答【教师】总结学生的回答【教师】讲解“素养之窗
17、”的内容(详见教材),了解我国智能产业的发展1.2机器学习的类型1.2.1 按学习的过程分类从学习过程来看,机器学习可分为监督学习(supervisedlearning)、无监督学习(unsupervisedlearning)、半监督学习(Semi-SUPerViSedlearning)、强化学习(reinforcementlearning)和深度学习(deeplearning)01 .监督学习监督学习是从带有类别标签(IabeI)的训练数据中学得一个模型,并基于此模型预测新样本标签的一种学习方式,是机器学习中使用最广泛的一种类型。监督学习的训练样本包含特征属性和类别标签两部分。例如,图1-2
18、中所示的叫集就是一个监督学习的孀集,其中头型、颜色、体型和叫声是数据集的特征属性,是否为猫属性即为类别标签。监督学习在手写文字识别、声音处理、图像处理、垃圾邮件分类与拦截等各个方面,都有广泛应用。)【教师】要求学生直阅资料,分组讨论,随机邀请学生进行回答请直阅相关资料,然后分组讨论,列举几个监督学习的例子。【学生】聆听、思考、回答【教师】总结学生的回答2 .无监督学习无监督学习是机器学习的另一大类学习方法,是在无标签的训练样本中发现数据规律的一种学习方式。无监督学习的训练样本中没有标签,这是它与监督学习最主要的区别。无监督学习在人造卫星故障诊断、视频分析、社交网站解析、数据可视化等方面有着广泛
19、应用。另外,无监督学习还可作为监督学习方法的前处理工具。3 .半监督学习半监督学习是监督学习与无监督学习结合在一起的一种学习方法。半监督学习的数据由大量的无标签数据和少量的有标签数据混合而成。因此,可通过在模型训练中引入无标签样本,来弥补监督学习训练样本不足的缺陷。例如,在识别芒果是否成熟的任务中,有这样的情形:在一个芒果园中,果农拿来5个芒果说这都是成熟的芒果,然后再指着树上的3个芒果说这些还不熟。如果我们根据这8个样本训练一个机器学习模型来预测新的芒果是否成熟,这样的训练样本显然太少了。此时,就可以使用半监督学习的方法,将树上的其他芒果都用上,这样训练样本就增加了,训练出来的模型性能更高。
20、【高手点拨】半监督学习方法训练模型时,可以先利用有标签的样本训练出一个模型,用这个模型去预测新的数据,然后询问专家,再将这个样本变为有标签样本;把这个新获得的有标签的样本加入训练集后重新训练一个模型,再去预测,依次重复,若每次都能预测出对改善模型性能帮助较大的数据,则只需询问专家较少的次数就能构建出较强的模型,从而大幅度降低标记成本。4 .强化学习强化学习是机器学习中一个较新的领域,它能根据环境的改变而改变,从而获取最大的收益.强化学习的思想来源于心理学中的行为主义理论,即动物如何在环境给予的刺激下,逐渐形成对刺激的反应,从而产生能获得最大收益的习惯性行为。例如,婴幼儿往往是为了获得父母的表扬
21、去做事情。强化学习正是模仿人类的这种学习行为而产生的一种学习方式。强化学习在机器人的自动控制、计算机游戏中的人工智能、市场战略的最优化等方面均有广泛应用。5 .深度学习深度学习的概念来源于对人工神经网络的研究,其模型结构是一种含多隐层的神经网络。深度学习使机器能模仿人类的视听与思考等活动,解决了很多复杂的模式识别难题,使得人工智能相关技术取得了很大进步。在海量数据中,深度学习的表现要比普通的机器学习更为出色。深度学习在搜索技术、数据挖掘、机器翻译、自然语言处理、多媒体学习和个性化技术等领域都有着广泛的应用.1 .2.2按完成的任务分类从机器学习完成的彳王务来看,机器学习可分为回归、分类和聚类等
22、学习任务.2 .回归回归属于监督学习,最初是统计学中的一种方法,用来预测某个变量的变化趋势,其预测结果是连续的值,如预测房价、预测股价等。若一个产品的实际价格为300元,通过回归分析预测值为299元,则认为这是一个比较好的回归分析.回归是对真实值的一种逼近预测.【教师】通过多媒体展示“回归任务”图片(详见教材),并介绍相关知识在机器学习领域中,回归任务的实现需要先对数据样本点进行拟合,再根据拟合出来的函数对输入的新数据进行输出预测,圆点表示带有标签的训练数据;回归曲线表示经过训练后获得的回归函数或回归模型。若该回归任务表示对商品价格走势的预测(X表示年份,y表示商品价格),则由回归函数可以预测
23、未来某年的商品价格。3 .分类分类是通过在已有数据的基础上进行学习,得到一个分类模型,该模型可以将待分类的数据集映射到某个给定的类别中,从而实现数据分类。其中,分类模型也称为分类器。分类属于监督学习,其数据集包含特征属性和类别标签两部分,其中类别标签是预设的类别号。例如,用机器学习模型判断一幅图上的动物是猫还是狗,假设用1代表猫,用2代表狗,那么模型的预测结果就是1或2,分别代表猫和狗。分类的最终正确结果只有一个,错误的就是错误的,不会有相近的概念.根据预设的类别数目,分类模型可分为二分类和多分类。例如,判断图片上的动物是猫还是狗,是二分类问题;如果要判断图片上的动物是自然界动物中的哪一类,则
24、属于多分类问题.*【教师】通过多媒体展示“分类任务”图片(详见教材),并介绍相关知识在机器学习领域,分类任务的实现需要先利用已有数据训练一个分类模型(类似于数据样本中的分界线),然后对输入的新数据进行预测,即根据分界线对新数据进行分类,实心的正方形和圆表示带有标签的训练数据;分界线表示经过训练后获得的分类模型;空心的正方形和圆表示对输入的新数据进行预测。4 .聚类聚类属于无监督学习,是按照某个特定标准把一个数据集分割成不同的类,使得同一类中的数据对象之间相似性尽可能大,不同类中的数据对象之间差异性也尽可能大。可见,聚类后的数据中,同类数据尽可能聚集到一起,不同类数据尽可能分离。聚类任务中,每个
25、类称为一个簇。【教师】通过多媒体展示“聚类任务”图片(详见教材),并介绍相关知识聚类任务常用于对目标群体进行多指标划分。例如,现有多个客户的购物记录数据,且未对数据进行标记,通过聚类任务可将具有相同购物习惯的客户汇聚成类,不同类中的客户购买的商品种类不同,店铺运营即可根据该反馈信息向客户推荐相关商品。由于聚类任务中的数据没有标签,所以不知道输入数据的输出结果是什么,但是可以清晰地知道输入数据属于数据的哪一类。【学生】聆听、思考、理解、记录课堂小结【教师】简要总结本节课的要点机器学习的概念与应用领域机器学习的类型【学生】总结回顾知识点作业布置【教师】布置课后作业请根据课堂知识,完成本章项目考核中与本次课程相关的题目。【学生】完成课后任务教学反思