《《人工智能深度学习应用开发》题库答案.docx》由会员分享,可在线阅读,更多相关《《人工智能深度学习应用开发》题库答案.docx(20页珍藏版)》请在课桌文档上搜索。
1、1.人工神经网络2. 机器学习3. 监督学习模式无监督学习模式4. 真实值(groundtruth5. 人工神经网络6. 数据量大计算力提升网络规模大7. 数据量硬件依赖特征工程解决问题的方法执行时间可解释性8. 计算机视觉自然语言处理强化学习9. B10. C11. C12. C13. D14. C15. D16. AB17. 18. 19. 20. 21. 22. 23. 24. 25. 人工智能最核心的部分可以理解为类似人的大脑,就是机器学习,机器学习是实现人工智能的核心方法,人工智能的核心就是由各种算法作为支撑的。神经网络简单来说就是机器学习众多算法中的一类,其原理就是模仿人脑的思维逻
2、辑。26. TheanOxSCikit-Ieam、Caffe、TorchMXNetPyTorCh、KerasTensorFlow027. 深度学习中的每种算法都具有相似的学习过程,深度学习过程的步骤如下:(1)选择相关数据集并准备进行分析;(2)选择要使用的算法,基于算法构建分析模型;(3)在训练数据集上训练模型,并根据需要对模型进行修改;(4)对训练得到的模型进行测试。28. 深度学习与机器学习的区别,深度学习与机器学习的主要区别体现在以下几个方面:数据量机器学习可以处理大量数据也可以处理少量数据,随着数据量的增加,机器学习的处理效果没有明显变化。而深度学习的特点在于,在一定范围内,随着数据
3、量的增加,深度学习的处理效果是上升的。(2)硬件依赖与传统的机器学习算法不同,深度学习算法需要执行大量的矩阵乘法运算,因此深度学习需要计算机的计算能力做支撑。(3)特征工程深度学习避免了开发每个新问题的特征工程的问题。数据和特征决定了机器学习的上限,算法和模型不过是逼近这个上限。深度学习不用像传统机器学习那样人为的合成高级复杂特征,深度学习只需利用经过先验知识处理的一阶特征,就可以学习到相关的高级复杂特征。(4)解决问题的方法传统的机器学习遵循标准程序,将问题分解成多个部分,先解决每个问题,然后将他们组合起来以获得最终的结果。而深度学习侧重于端到端的解决问题。执行时间深度学习因数据量的庞大和模
4、型参数的众多,一般需要大量的时间进行训练,机器学习所需要的执行时间则相对较短。(6)可解释性可解释性是比较机器学习和深度学习算法的主要因素。机器学习算法为我们提供了清晰的规则和可解释的算法推理过程,因此像决策树、逻辑回归等机器学习算法主要用于工业中需要可解释性的场景中。深度学习算法主要是通过仿生的神经网络做算法推理。29. 无监督学习中,训练样本未按其所属的类别进行标记。无监督学习模型是识别无标签数据结构的模型。该模型通过寻找具有共同特征的数据,并根据数据内部知识特征对其进行分类,这种学习算法适用于聚类问题。30. 有监督学习以训练集作为模型的输入,其中每个样本都有标注信息,我们称标注信息为真
5、实值(groundtruth)o模型的输出值与真实值之间的差值用损失函数(IoSS)来衡量,采用最小损失函数执行训练过程。训练完成后,使用验证集或测试集测量模型的准确性。31. 略32. 略33. 略1 .深度学习2 .图像识别自然语言处理3 .张量4 .计算图(COmPUtatiOnGraph)5 .标量向量矩阵张量6 .数值型字符串型布尔型7 .监督学习8 .向量9 .D10 .B11 .D12 .13 .14 .15 .16 .17 .18 .TensorFlow框架具有许多优点,如高度灵活性、真正的可移植性、连接研究与产品、自动微分、多语言选择以及最大化性能六大特性。19 .Tenso
6、rFlow的主要功能有以下几个方面:以张量的多维数组轻松定义、优化和计算数学表达式;(2)支持深度神经网络和机器学习技术的编程;(3)具有多种数据集、网络模型等高度可扩展的计算模块;(4)允许模型部署到工业生产的应用中;(5)支持GPU计算,实现了自动化管理。提供了对初学者友好的高级APIKeraS接口。20 .例:importtensorflowastfa=tf.constant(5)print(八)print(a是维Tensor*.format(a.ndim)21 .例:pat.v1astfpat.v1.disable_eager_execution()matrix1=tf.constan
7、t(3,3,1,2,2,2,1,1,1)matrix2=tf.constant(2,3,4)product=tf.matmul(matrixl,matrix2)print(product)withtf.Session()assess:result=sess.run(product)print(result)22 .答案详见2.6节。23 .答案详见2.7节。单元31 .用户友好模块化易扩展性基于PythOn实现2 .序列式(SeqUential)函数式(FUnCtional)子类(SUbCIaSSing)3 .激活函数损失函数优化器正则化器4 .目标函数5 .有准确率(ACCUraCy)精确度
8、(PreCiSion)召回率(ReCan)6 .有激活函数损失函数优化器正则化器7 .输入层隐藏层输出层卷积层池化层8 .一维二维三维9 .数据预处理建立模型编译模型训练模型评估模型模型预测10.importkerasfromkeras.datasetsimportmnistfromkeras.modelsimportSequentialfromkeras.layersimportDense,Dropoutfromkeras.optimizersimportRMSpropimportnumpyasnp11. D12. A13. A14. C15. B16. ABC17. 18. 19. 20.
9、 21. 22. 23. 24. 25.Keras提供了一种简洁的方法来创建基于TensorFlow或Theano的深度学习模型,并运用了各种优化技术使神经网络APl调用变得轻松高效。KeraS框架具有以下功能特点:(1)用户友好,Keras是专门为用户而设计的API;(2)模块化网络模型是由一系列独立的、完全可配置的模块组成的序列;(3)易扩展性使用keras创建的模型,可以增加或删除模块,以提升模型的性能,新的模块是很容易添加的;(4)基于Python实现KeraS没有特定格式的单独配置文件,模块是用PyIhon代码来定义的,这些代码紧凑,易于调试,并且易于扩展。26.Keras提供了许多
10、内置的与神经网络相关的功能模块,用户可以方便地调用模块创建KeraS模型和KeraS层,常用的核心模块有激活函数、损失函数、优化器和正则化器等。27.Keras模型中的每个层代表神经网络模型中的对应层,Keras提供了许多预构建层,如输入层、隐藏层、输出层、卷积层、池化层等,因此提高了构建复杂神经网络模型的效率。28.深度学习框架Keras是像搭积木般构建神经网络模型,主要分为6个部分,每个部分只需调用kerasAPI函数就能实现。使用keras框架建模流程通常包括:(1)数据预处理:获取并预处理训练数据;(2)建立模型:定义由网络层组成的网络或模型,将输入数据映射成目标;(3)编译模型:配置
11、训练过程参数,包括损失函数、优化器、模型评估指标;(4)训练模型:调用函数在训练数据上进行迭代,更新模型权重;(5)评估模型:使用测试集或验证数据集,评估模型的性能是否达到要求;(6)模型预测:使用训练好的模型预测新的数据。29.Keras是功能强大且易于使用的深度学习框架之一,它建立在TensorFlow等流行的深度学习框架的基础上,旨在快速定义深度学习模型,使创建深度学习模型更为简单。30. 详见3.5.31. 详见3.6.32. 略。1. 神经网络(NeUraINetwork)2. 神经元3. 生物神经元模型4. 输入层输出层5. 全连接神经网络6. Sigmoid函数Solftmax7
12、. 前馈神经网络8. 感知机9. C10. C11. C12. C13. A14. AC15. A16. D17. 18. 19. 20. 21. 22. 23. 24. 25.随着神经科学和认知科学的不断进步,科学家们对人类大脑的神经系统的认知更为清晰,早期的神经科学家构造了一种模仿人脑神经系统的数学模型,称为人工神经网络(ArtiflCialNeuralNetwork,ANN),简称神经网络。在机器学习领域,神经网络是指由很多人工神经元构成的网络结构模型。26.神经网络的神经元中,输入数据通过加权求和后,还被作用了一个函数,这个函数就是激活函数。激活函数有以下特点:1.非线性;2可微性;3
13、.单调性;4.输出与输入值相差不大;5.输出值范围不大。27.Sigmoid函数也叫1.ogistic函数,定义为:l/(l+e),优点:它的一个优良特性就是能够把的输入压缩”到0,l区间,这个区间的数值在机器学习常用来表示以下意义:概率分布,0,1区间的输出和概率的分布范围契合,可以通过Sigmoid函数将输出转译为概率输出信号强度,一般可以将01理解为某种信号的强度,如像素的颜色强度,1代表当前通道颜色最强,0代表当前通道无颜色;抑或代表门控值(Gate)的强度,1代表当前门控全部开放,0代表门控关闭Sigmoid函数,连续可导,相对于阶跃函数,可以直接利用梯度下降算法优化网络参数,应用的
14、非常广泛。28.卷积(COnVOkItion),也叫褶积,是分析数学中一种重要的运算。在信号处理或图像处理中,经常使用一维或二维卷积。29.1.eNet-5共有7层,包括2个卷积层、2个池化层、3个全连接层。过程详见4.730. 1.eNet-5是最早提出的卷积神经网络,该网络是由Yann1.eCun基于1988年以来的工作提出。1.eNet-5的主要贡献:1.在神经网络中引入卷积层;2.引入下采样;3.卷积+池化(下采样)+非线性激活的组合是CNN的典型特征;4.使用MP1.作为分类器。31.model=Sequential()model.add(Conv2D(filters=6,kemel
15、_size=(5,5),padding=valid,input_shape=(1,28,28),activation=tanh)model.add(MaxPool2D(pool_size=(2,2)model.add(Conv2D(filters=16,kemel_size=(5,5),padding-valid1,activation=tanh)model.add(MaxPool2D(pool_size=(2,2)#池化后变成16个4x4的矩阵,然后把矩阵压平变成一维的,一共256个单元。model.add(Flatten()#下面是全连接层model.add(Dense(120,activ
16、ation=tanh,)model.add(Dense(84,activation=tanh,)model.add(Dense(10,activation=softmax)32.# 创建模型序列model=SequentialO# 第一层卷积网络,使用96个卷积核,大小为Ilxll步长为4,要求输入的图片为227x227,3个通道,不加边,激活函数使用relumodel.add(Conv2D(96,(11,11),strides=(l,1),input_shape=(28,28,1),padding-same,activation-relukerne1.initialiZer=uniform)
17、# 池化层model.add(MaxPooling2D(poo1.size=(3,3),strides=(2,2)# 第二层加边使用256个5x5的卷积核,加边,激活函数为relumodel.add(Conv2D(256,(5,5),strides=(1,1),Padding=same,activation-relukernel_initializer-uniform)# 使用池化层,步长为2model.add(MaxPooling2D(pool_size=(3,3),strides=(2,2)# 第三层卷积,大小为3x3的卷积核使用384个model.add(Conv2D(384,(3,3)
18、,strides=(1,1),padding=,same,activation-relu,kernel_initializer=,uniform,)# 第四层卷积,同第三层model.add(Conv2D(384,(3,3),strides=(1,1),Padding=same,activation-relukernel_initializer-uniform)# 第五层卷积使用的卷积核为256个,其他同上model.add(Conv2D(256,(3,3),strides=(l,1),padding=,same,activation-relu,kernel_initializer=,unif
19、orm)model.add(MaxPooling2D(pool_size=(3,3),strides=(2,2)model.add(Flatten()model.add(Dense(4096,activation=relu)model.add(Dropout(0.5)model.add(Dense(4096,activation=relu,)model.add(Dense(10,activation=softmax)pile(loss=,categorical_crossentropyoptimizer=,sgdmetrics=accuracy,)model.summary()33.详见4.1
20、0.回归2. 一元线性回归多元线性回归3. 输入变量(自变量)输出变量(因变量)4. 损失函数5. 好6. 均方误差7. 过拟合(overfitting)欠拟合(underfitting)8. 太大9. 误差10. A11. B12. A13. C14. A15. B16. AB17. AB18. A19. 20. 21. 22. 23. 24. 25. 26. 27. 28.机器学习的所有算法都需要最大化或者最小化目标函数,在最小化场景下,目标函数又称损失函数。29.平均绝对误差(MeanAbSokneError,MAE),又称1.l损失,用于评估预测结果和真实数据集的接近程度,其值越小说明
21、拟合效果越好。均方误差(Meansquarederror,MSE),又称1.2损失,该指标计算的是拟合数据和原始数据对应样本点的误差的平方和的均值,其值越小说明拟合效果越好。30.过拟合是指训练误差和测试误差之间的差距太大。换句换说,就是模型复杂度高于实际问题,模型在训练集上表现很好,但在测试集上却表现很差。训练数据集样本单一,样本不足。如果训练样本只有负样本,然后那生成的模型去预测正样本,这肯定预测不准。31.过拟合出现的原因为训练数据集样本单一,样本不足。防止过拟合方法主要有:获取和使用更多的数据(数据集增强);采用合适的模型(控制模型的复杂度);降低特征的数量;1.l/1.2正则化;加入
22、DrOPOUt;采用EarIyStoPPing方法。32.详见5.4.33. 详见5.71.可信度2. 图片分类技术3. 传统图像分类深度学习图像分类4. 二分类(BinaryClassification)5. 准确率精确率召回率6. 负对数似然损失(neglog-likelihoodloss)交叉燃损失(Cn)SSentropyloss)指数损(exponentialloss)7. 交叉端损失函数(CrossEntropy1.oss)8. 多类分类(MUltiClaSSCIaSSifiCatiOn)9. 多分类交叉端损失函数10. D11. D12. D13. B14. B15. 16. 1
23、7. X18. 19. 20. 21.图像分类问题受各种因素的影响,模型的性能主要面临一下几种挑战:(1)类内变化:类内差异是同一类图像之间的差异。(2)比例变化:同一对象的图像具有多种大小,且可能大小差异很大。(3)视点变化:视点变化即相对于如何在图像中拍摄和捕获对象。(4)遮挡:图像中分类对象无法完全查看,很大一部分隐藏在其他对象的后面。(5)光照条件:由于照明强度不同,在图像中像素的强度级别也有所不同。(6)背景:如果图中有很多对象,找到特定对象非常困难22.按照图像分类的发展过程划分,图像分类可以分为传统图像分类和深度学习图像分类。传统的图像分类方法有很多,如使用近邻分类器(Neare
24、stNeighborClassifier),将测试图片与训练集中的每个图片去对比,将差别最小的那个类的标签,作为预测结果。图像分类从传统方法到基于深度学习的方法,得益于计算机算力的提升。23.二分类模型常用的模型评价指标有准确率、精确率、召回率等。准确率是最常用的评价分类问题的性能指标,其定义是对于给定的数据,分类正确的样本数占总样本数的比例;精确率(PreCiSiOn)表示分类正确的正样本个数(TP)占分类器判定为正样本的样本个数(TP+FP)的比例;召回率(ReCall)是指分类正确的正样本个数(TP)占真正的正样本个数(TP+FN)的比例。24. 详见6.6.25. 详见3.8.1. 何
25、时迁移何处迁移如何迁移2. 新数据集的大小数据集的相似程度3. 小数据集、相似数据小数据集、不相似数据大数据集、相似数据大数据集、不相似数据4. AB5. D6. D7. 8. 9. 10. 11. 12. 13. 14.迁移学习的基本问题主要有:何时迁移,给定待学习的目标,首先要做的便是判断任务是否适合进行迁移学习;何处迁移,判断任务适合迁移学习之后,第二步要解决的是从何处进行迁移。包括要迁移什么知识,从哪个地方进行迁移;如何迁移如何迁移要求学习最优的迁移学习方法,迁移学习根据学习方法可以分为:基于实例的迁移学习、基于特征的迁移学习、基于模型的迁移学习以及基于关系的迁移学习。15.迁移学习的
26、训练方法和技巧主要依据两种情况:新数据集的大小如果新数据集的数据量为几万笔数据,就属于大数据集;如果新数据集的数据量为几千或几百笔数据,就属于小数据集;数据集的相似程度,新数据集与预训练模型所使用的数据集之间的相似程度。16. .根据新数据集的大小和数据集的相似程度,可以将迁移学习方法分为四种情况:1.小数据集、相似数据;2.小数据集、不相似数据;3.大数据集、相似数据;4.大数据集、不相似数据。17 .当完成新数据集的分类任务时,不必搭建一个全新的网络模型从头训练,可以在预训练模型的基础上进行微调训练模型,以得到适用于新数据的分类的模型。这种训练方式被称为迁移学习。18 .略19 .详见7.520 .详见7.621 .略。