《2023年全国工业和信息化技术技能大赛-工业大数据算法赛项大赛方案、实操和理论赛题样题、技术文件.docx》由会员分享,可在线阅读,更多相关《2023年全国工业和信息化技术技能大赛-工业大数据算法赛项大赛方案、实操和理论赛题样题、技术文件.docx(58页珍藏版)》请在课桌文档上搜索。
1、2023江苏省数字化解决方案设计师(工业大数据算法)大赛方案一、大赛时间()理论竞赛:10月28日(周六)(二)实操竞赛:10月29日(周日)二、大赛地点常州信息职业技术学院三、举办单位(一)主办单位:江苏省工业和信息化厅、江苏省人力资源和社会保障厅、江苏省教育厅、江苏省总工会、共青团江苏省委(二)承办单位:常州信息职业技术学院(三)技术支持单位:易往数字科技(北京)有限公司、深圳市物新智能科技有限公司四、大赛日程日期时间事项地点10月15日17:00之前大赛报名指定链接10月20日14:00-16:00赛项说明会线下会议:常州信息职业技术学院工业互联网大楼1021会议室线上会议:会议链接在赛
2、项QQ群758669610提前通知10月27日12:00之前竞赛报到酒店(常州武进科教城)10月27日15:30-16:30领队会常州信息职业技术学院行政楼22110月28日9:00-10:00理论竞赛常州信息职业技术学院(工业互联网大楼0410)10月28日13:00-17:00职工组实操竞赛常州信息职业技术学院体育馆10810月29日8:00-12:00学生组实操竞赛常州信息职业技术学院体育馆10810月29日16:00闭幕式常州信息职业技术学院行政楼403注:以上日程安排如有调整,另行通知。五、选拔规则本届省赛通过理论竞赛遴选不超过20队参加实操竞赛(每个组别各不超过10队1理论竞赛满分
3、为100分,按20%的比例折算计入竞赛总成绩。理论赛题均为客观题,采用机考方式实现。实操竞赛满分为100分,按80%的比例折算计入竞赛总成绩。折算后的理论竞赛成绩与实操竞赛成绩相加得出参赛选手竞赛总成绩,满分为100分。六、命题原则大赛命题按照“2023年全国工业和信息化技术技能大赛数字化解决方案设计师(工业大数据算法)赛项“全国总决赛命题方案进行命题。在命题方向上,聚焦新一代信息技术与制造技术深度融合领域,以解决工业大数据应用实际需求为命题方向,设置算法赛题。在考核重点上,考核工业大数据算法等基本技能的同时,重点突出企业所需专业技能及新技术应用。重点考察参赛选手构建大数据算法模型实现问题解析
4、、数据处理、特征工程、模型构建、训练优化的能力和技术水平,以及对智能制造系统原理的掌握程度。七、考核范围(一)理论竞赛1 .竞赛范围以工业大数据和工业人工智能算法应用知识为主,智能制造技术、数据信息安全法律法规等相关知识为辅。(1)工业大数据工业大数据平台架构(数据架构、数据技术架构、应用平台架构)、数据分析概述、数据收集与导入、数据清洗与预处理、数据挖掘基础、主成分分析、分类器与决策树、聚类思想与建模、神经网络思想与建模、深度学习基础。(2)工业人工智能算法神经网络思想与建模、深度学习基础、工业人工智能算法的选择与应用,机器视觉理论基础与框架、图像分析基础和图像变换、图像预处理、边缘检测与轮
5、廓表示。(3)数控机床和数控系统智能制造技术基础、智能制造典型技术、智能制造技术应用、机电一体化基础基本认知、可编程控制器(PLC)基础。2 .赛题类型赛题分为三种类型:单项选择题、多项选择题和判断题。3 .竞赛时间理论竞赛时间为1小时。4 .命题方式由大赛组委会组织专家组统一命题。5 .考试方式采用笔试或计算机考试。()实操竞赛本赛项的实际操作竞赛突出工业大数据算法在工业生产中的应用,针对数控加工系统中的机器视觉识别准确性和加工精度稳定性问题,通过大数据及人工智能算法,实现智能加工的误差实时补偿。实际操作竞赛以考核工业大数据及工业人工智能算法应用技术技能为主,包括图像数据采集、云平台使用、算
6、法模型训练及优化以及安全文明竞赛等在实际操作竞赛考查。1.竞赛范围与内容为全面考查参赛选手的职业综合素质和技术技能水平,实际技能操作竞赛分为5个环节:硬件设备搭建、训练数据样本采集、工业视觉模型训练与部署、误差补偿算法模型训练与部署和模拟生产验证。具体内容见表Io表1竞赛范围与内容序号考核任务考核要点与相关技术要求1硬件安装接线1 .数据采集硬件平台安装与调试。2 .智能加工设备基准设置。3 .通讯系统建立连接和测试。2图像训练数据1.通过工业视觉进行工件训练样本数据采集,并进行数据预处理。采集2 .采集足够训练使用数量的图片训练集。3 .样本数据分类保存、云平台存储。3工业视觉模型训练与部署
7、1 .模型训练工具设置,将训练集配置为模型的制定输入参数。2 .优化模型训练方法,选定恰当的激活函数,以及训练参数。3 .在云平台给定环境中进行模型训练,更新迭代模型,并将训练模型进行固化。4 .优化训练算法模型,配置传入参数。5 .配置结果应用,以接口方式输出给设备。4误差算法模型训练与部署1 .设计误差补偿模型,或选定恰当的模型,以及设定训练参数。2 .更新迭代模型,将训练完成的模型进行固化。3 .完成误差实时补偿模型部署。4 .验证误差补偿模型部署效果。5模拟生产验证1 .正确进行产线动作测试、加载补偿算法,通过运动控制单元模拟智能加工进行加工生产验证Q2 .补偿参数微调。3 .产线生产
8、效率调整。4 .正确使用防护用具。5 .符合安全操作要求。6 .保持工作区域内场地、材料和设备的清洁。7 .良好的职业素养。实操竞赛由参赛选手按工作任务书的要求完成,具体工作任务见下:(I)任务一:硬件安装接线根据任务书给定的任务要求,选手进行数控加工装置、工业视觉相关设备测试,包括相机测试、光源环境调试、通讯线路连接、设备基准点设置等。(2)任务二:图像训练数据采集根据任务书给定的任务要求,选手使用视觉系统进行若干工件图像数据采集,以丰富工件样本图像数据库。该环节所采集到的样本图片数据的数量和质量将会直接影响后续的模型训练环节。(3)任务三:工业视觉模型训练与部署根据任务书给定的任务要求,选
9、手进行基于数据采集的样本图片进行视觉模型训练,可选择、调用云端已提供的完整模型框架(基于TensorFlow),通过设定相应参数进行模型训练;也允许选手自行搭建视觉模型,上传云端进行训练。训练好的模型能够返回待测工件和标准件的相似度。模型训练完成之后,参赛选手需要将模型部署在服务器上,并且在云平台上进行相关适配。(4)任务四:误差算法模型训练与部署根据任务书给定的任务要求,选手基于组委会提供的工件样本图片及对应的工件加工工艺参数数据集,进行误差补偿算法模型的构建。选手需完成数据清洗、模型训练、模型部署等过程。模型训练完成之后,参赛选手需要将模型部署在服务器上,并且在云平台上进行相关适配。(5)
10、任务五:模拟生产验证根据任务书给定的任务要求,选手根据组委会提供的加工图纸进行若干个待加工件的生产验证,软件导入加工对象的坐标集,并通过误差补偿算法使加工出的图形补偿干扰因素造成的误差,使加工图形尽可能准确。最后通过视觉检测系统进行质量验证。2 .比赛时间实操比赛时间为4小时。3 .命题方式由大赛组委会组织专家组统一命题。4 .大赛场地与设施(1)大赛场地大赛工位:每个工位占地IOm2,标明工位号,并配备比赛平台、工作准备台1张、座椅2把、扫把簸箕纸篓各1个。赛场每工位提供独立控制并带有漏电保护装置的220V单相三线两种电压的交流电源(三相、单相电源分别控制)供电系统有必要的安全保护措施。(2
11、)大赛设施大赛平台大赛平台与全国总决赛保持一致。由易往数字科技(北京)有限公司、深圳市物新智能科技有限公司提供。耗材和工具根据大赛赛题需要提供。附件1:2023年江苏省数字化解决方案设计师(工业大数据算法)赛项任务书(实操样题)附件2:2023年江苏省数字化解决方案设计师(工业大数据算法)赛项任务书理论知识竞赛命题方案说明(理论样题)附件3:2023年江苏省数字化解决方案设计师(工业大数据算法)赛项技术文件附件4:2023年江苏省数字化解决方案设计师(工业大数据算法)赛项报名表2023年全国工业和信息化技术技能大赛数字化解决方案设计师(工业大数据算法)赛项实操赛题(样例)2023年8月一、竞赛
12、内容分布任务一:硬件安装接线100%任务二:图像训练数据采集任务三:工业视觉模型训练与部署任务四:误差算法模型训练与部署任务五:模拟生产验证职业素养与安全意识5%(扣分项)二、竞赛时长竞赛时长为4个小时。三、竞赛注意事项1 .竞赛所需的硬件、软件和辅助工具由组委会统一布置,选手不得私自携带任何软件、移动存储、辅助工具、移动通信等进入赛场;2 .请根据大赛所提供的比赛环境,检查所列的软件及工具组件清单是否齐全,计算机设备是否能正常使用;3 .比赛完成后,比赛设备、软件和赛题请保留在座位上,禁止将比赛所用的所有物品(包括试卷和草纸)带离赛场;4 .裁判以各参赛队提交的竞赛结果文档为主要评分依据。所
13、有提交的文档必须按照赛题所规定的命名规则命名,不得以任何形式体现参赛院校、赛位号等信息;5 .本次比赛采用统一网络环境比赛,不得更改客户端的网络地址信息,对于更改客户端信息造成的后果,由参赛选手自行承担;6 .请不要恶意破坏竞赛环境,对于恶意破坏竞赛环境的参赛者,组委会根据其行为予以处罚直至取消比赛资格;7 .比赛中出现各种问题及时向监考裁判举手示意,不要影响其他参赛队比赛。四、竞赛结果的提交按照题目要求,提交规定数量的模拟加工后的工件。工业大数据算法相关数据会由软件自动生成采集,并作为本次竞赛的评价标准。五、竞赛任务描述质量和效率是智能制造永恒的主题,在金属切削加工智能制造产线中影响质量和效
14、率的关键装备是数控机床。数控机床属于精密制造装备,虽然在出厂时自身的技术指标均能达到高水准,但是应用在实际产线上时,它的加工精度会受夹具、刀具、环境温度、振动、部件老化、工件材料一致性等因素影响。这一点也成了制约国内企业进一步提升智能制造水平和规模的主要因素之一。工厂内有一套智能数控产线在实际生产时,在工件生产过程中由于设备的振动和温度变化等因素导致原有的生产工艺无法实现高效率和高质量的生产。你所在的小组通过采集产品生产过程的大量数据,采用大数据与人工智能算法分析等技术分析和解决设备的问题,并通过优化产线程序流程及调整工艺参数,最终提高生产效率和产品质量。参赛选手需要完成的主要任务如下:任务一
15、:硬件安装接线(1)相机、镜头、光源和生产加工夹具固定到合适的拍摄位置;(2)相机、光源的电源线、通讯线连接到对应接口,走线应规范美观;(3)相机、光源上电,打开相机软件,实时监控相机拍摄画面;(4)调整相机和光源安装高度,具有与给定样品图片一致的视野范围;(5)调整相机光圈和焦圈并锁紧,使图片清晰,明暗与给定样品图片一致;(6)启动设备和软件,将样品放在治具台上,点击拍照按钮,相机拍照采集图像。任务二:图像训练数据采集(1)启动算法平台虚拟机;(2)启动Kimgae软件;(3)启动图像检测软件,点击复位,保证“相机、Kimage软件”为已连接状态;(4)打开Umage软件,运行回零点,测试运
16、动机构动作正常;(5)打开图像识别客户端软件,将运行模式选择训练模式,点击复位,将提供的合格产品部分放入运动平台,点击开始,进行手动标注,产品图像试采集;(6)调整待上传图片,确保裁剪后加工件能完整显示;(7)训练模式下,将提供的所有不合格产品逐张放入到平台,进行手动标注,每放一张纸,点击提交(在提交前换纸),不合格产品图像正式采集;(8)训练模式下,将提供的所有合格产品逐张放入到平台,进行手动标注,每放一张纸,点击提交(在提交前换纸),合格产品图像正式采集;(9)上传样本越多,越有利于后续图像识别模型的训练。基于TensorFlow平台将上传的图像用于模型训练,模型能够返回待测工件和标准件的
17、相似度;(10)将训练出来的模型进行部署,并且在云平台上进行相应的适配。任务三:工业视觉模型训练与部署(1)样本数据读取,读取本地图片数据(包括内置的200张样本图片及选手拍照上传的样本图片),并将图片调整至合适的分辨率;(2)加载样本数据,创建图片训练数据集。通过工作台将数据进行可视化展示,查看数据集是否正确。并调整训练性能参数;(3)对加载的样本图片进行图像预处理,程序中对图像预处理的方法和函数由选手自行选择(TensorFlow中内置了多种图像预处理的方式),选手应将图像预处理的方法和思路填写在下面的文本框中:图像预处理的方法和思路如下:(4)训练模型设置,设置训练算法的输入层、中间层、
18、输出层、优化器、损失函数、评估标准等,进行训练模型的构造;(5)模型训练,设置批次大小、迭代次数、验证集,将数据提供给模型进行训练,通过不断的优化参数设置和丰富样本数据,循环训练数据,找到合适的训练模型;(6)模型部署,将训练后的模型部署到指定的位置,保证云平台可以访问到该模型;(7)模型验证,通过加载验证图片集完成识别正确率验证,来判断模型是否满意,如果满意则可以进行下一个任务,如果不满意则继续训练模型。任务四:误差算法模型训练与部署(1)通过numpy、pandas等大数据工具库加载误差补偿样本数据,并对加载的样本数据进行预处理,程序中对数据预处理的方法和函数由选手自行选择(TenSOrF
19、IOW中内置了多种数据预处理的方式),选手应将数据预处理的方法和思路填写在下面的文本框中:数据预处理的方法和思路如下:(2)误差模型算法训练:观察和分析样本数据,构造合适的训练模型,对误差生成函数F(X)进行补偿,并打印出模型的MSE均方误差(本竞赛中MSE0.2加工出的产品视为不合格品);(3)模型部署,将训练后的模型部署到指定的位置,保证云平台可以访问到该模型。任务五:模拟生产验证(1)打开klmage软件,运行回零点,测试运动机构动作正常;(2)打开图像识别客户端软件将运行模式切换到检测模式,将白纸放入到运动平台上,点击开始,开始试加工生产;(3)观察加工效果调整补偿参数,优化误差偏差模
20、型,并重新部署;(4)观察加工效率,调整速度;(5)以上都调整完毕后,开始正式生产,将盖章的5张白纸用于正式加工生产,每张白纸上加工4个产品,生产完4个产品后更换白纸,再点击开始,总共需要生产20个加工产品。本次竞赛将根据产品合格情况及图像识别准确率,进行综合成绩评定。注意:1.盖章白纸仅提供5张,后续不再提供;2 .当选手完成两个模型部署后,在盖章的纸上进行正式生产期间,不应再对模型进行优化,否则将因为模型版本不一致,进而导致生产中断;3 .若比赛时间结束,选手仍在生产中,则将对生产设备进行强制急停。2023全国行业职业技能竞赛数字化解决方案设计师(工业大数据算法)赛项理论赛题(样例)202
21、3年8月一、单选题(每题1分,共30分)1、人工智能的目的是让机器能够(),以实现某些脑力劳动的机械化。A、具有智能B、和人一样工作C、完全代替人的大脑D、模拟、延伸和扩展人的智能2、下列关于人工智能的叙述不正确的是OAs人工智能技术它与其他科学技术相结合极大地提高了应用技术的智能化水平。B、人工智能是科学技术发展的趋势。C、因为人工智能的系统研究是从上世纪五十年代才开始的,非常新,所以十分重要。D、人工智能有力地促进了社会的发展。3、人工智能研究的一项基本内容是机器感知。以下列()不属于机器感知的领域。A、使机器具有视觉、听觉、触觉、味觉、嗅觉等感知能力。B、让机器具有理解文字的能力。C、使
22、机器具有能够获取新知识、学习新技巧的能力。D、使机器具有听懂人类语言的能力4、尽管人工智能学术界出现“百家争鸣”的局面,但是,当前国际人工智能的主流派仍属于:A、连接主义B、符号主义C、行为主义D、经验主义5、被誉为国际“人工智能之父”的是:As图灵(TUring)B、费根鲍姆(FeigenbaUm)C、傅京孙(KSFu)D、尼尔逊(NiISSOn)6、人工智能的含义最早由0于1950年提出,并且同时提出一个机器智能的测试模型。A、明斯基B、扎德C、图灵D、冯.诺依曼7、下列哪个不是人工智能的研究领域0A、机器证明B、模式识别C、人工生命D、编译原理8、为了解决如何模拟人类的感性思维,例如视觉
23、理解、直觉思维、悟性等,研究者找到一个重要的信息处理的机制是()A.专家系统B.人工神经网络C.模式识别D.智能代理9、下述()不是人工智能中常用的知识格式化表示方法。A、框架表示法B、状态空间表示法C、语义网络表示法D、形象描写表示法o人工智能应用研究的两个最重要最广泛领域为:()A、专家系统、自动规划B、专家系统、机器学习C、机器学习、智能控制D、机器学习、自然语言理解11、一般来讲,下列语言属于人工智能语言的是()。A.VJB.C#C. FoxproD. 1.ISP12、我国学者吴文俊院士在人工智能的()领域作出了贡献。A.机器证明B.模式识别C.人工神经网络D.智能代理13、数控机床的
24、性能很大程度上取决于。的性能。A.计算机运算B.机械结构C.位置检测系统D.伺服系统14、人工智能诞生于什么地方?()A. DartmouthB. 1.ondonC. NewYorkD. 1.asVegas不是它要实现的目标。15、自然语言理解是人工智能的重要应用领域,下面列举中的A.理解别人讲的话B.对自然语言表示的信息进行分析概括或编辑C.自动程序设计D.机器翻译16、下述()不是人工智能中常用的知识格式化表示方法。A.框架表示法B.产生式表示法C.语义网络表示法D.形象描写表示法17、数控机床坐标系是采用()。A.左手坐标系B.笛卡尔直角坐标系C.工件坐标系D.自定义坐标系18.CNC是
25、指()的缩写。A.主动化工厂B柔性制造体系C.计算机数控体系D.数控加工中心19、通常数控系统除了直线插补外,还有()。A.正弦插补B.圆弧插补C.抛物线插补D.多义线插补20、数控机床精度检验中,()的检验是表明所测量的机床各运动部位在数控装置控制下运动所能达到的精度。A切削精度B.几何精度C.定位精度D.以上答案都不对21、人工智能的发展历程可以划分为()A.诞生期和成长期B.形成期和发展期C.初期和中期D.初级阶段和高级阶段22、机器人之父是指:()A.阿兰.图灵B.伯纳斯.李C.莎佩克D.英格伯格和德沃尔23、机器翻译属于下列哪个领域的应用?()A.自然语言系统B.机器学习C.专家系统
26、D.人类感官模拟24、智能机器人可以根据()得到信息。A.思维能力B.行为能力C.感知能力D.学习能力25、自动识别系统属于人工智能哪个应用领域?()A.自然语言系统B.机器学习C.专家系统D.人类感官模拟26、人工神经网络特点和优越性主要表现在()A.自学习功能B.自动识别功能C.高速寻找优化解的能力D.联想存储功能27、语音识别、语义理解、语音合成、OCR识别、人脸识别等都属于人工智能技术,以下哪种事物没有应用到人工智能技术()A.机器人B.无人机C.微信客服D.地铁安检28、国内外首个全方位人工智能开放平台是()A.人工智能云B.凌云C.灵云D.人机交互云29、莘果发布会上最新推出的Ho
27、mePod应用了环形麦克风阵列技术,以下哪项功能不包含在该技术中。()A.语音降噪B.回声消除C.语音合成D.声源定向30、以下技术中,不属于人工智能技术的是。A.自动计算,通过编程计算456*457*458*459的值B.文字识别,如通过OCR快速获得的图像中出汉字,保存为文本C.语音输入,通过话筒将讲话内容转成文本D.麦克风阵列,如利用灵云该技术实现远场语音交互的电视二、多项选则题(每题2分,共40分。每题有2个及2个以上正确答案,多选或少选均不得分)1 .计算智能的主要内容包括0A.神经计算B.进化计算C.免疫计算D.蚁群算法2 .关于搜索与求解,描述正确的是0A.搜索是为了达到某一目标
28、而多次进行某种操作、运算、推理或计算的过程B.所有的智能活动过程,都可以看作或者抽象为一个基于搜索的问题求解C.搜索是人在求解问题时不知现成解法的情况下所采取的一种普遍方法D.搜索可以看作人类和其他生物所具有的一种元知识3 .按用途分类,专家系统可分为OA诊断型解释型B.预测型决策型C设计型规划型D.控制型调度型4 .采用生理模拟和神经计算方法的人工智能研究被称为()A.连接主义B.逻辑学派C.生理学派D.符号主义5 .智能控制的开发,目前认为有以下途径OA.基于数据挖掘的专家智能控制B.基于遗传算法的软计算控制C.基于人工神经网络的神经网络控制D.以上说法都不对6 .联想存储的特点是()A.
29、可以存储许多相关(激励,响应)模式对B.以分布、稳健的方式存储信息C.即使输入激励模式完全失真时,仍然可以产生正确的响应模式D.可在原存储中加入新的存储模式7.关于谓词逻辑,下列描述正确的是OA.紧接于量词之后被量词作用的谓词公式称为该量词的辖域B.在一个量词的辖域中与该量词的指导变元相同的变元称为约束变元C.仅个体变元被量化的谓词成为一阶谓词D.个体变元、函数符号和谓词符号都被量化的谓词成为二阶谓词8广义不确定性可分为OA.粗糙性B.模糊性C.不完全性D.时变性9.神经网络可以按()A.学习方式分类B.网络结构分类C.网络的协议类型分类D.网络的活动方式分类10.数据仓库的基本特征包括OA.
30、数据仓库的数据是面向主题的B.数据仓库的数据是集成的C.数据仓库的数据是稳定的D.数据仓库的数据是演时间不断变化的11 .下列属于PLC的模拟量控制的是()。A.温度B.液位C.压力D.灯亮灭12 .数控机床的组成部分包括0。A.输入输出装置B.CNC装置C.伺服系统D.机械部件13 .下列属于旋转型检测装置的是()。A.磁栅B.测速发电机C.旋转变压器D.光电编码器14 .下列特点中,()是数控机床主传动系统具有的特点。A.转速高、功率大B.变速范围窄C.主轴变换迅速可靠D.主轴组件的耐磨性高15 .与数控机床的使用条件相符的是()。A.地基牢靠,有隔震措施B.保障一定的环境温度和湿度C.稳
31、定的供电电源,有抗干扰措施D.无需保护接地16 .云计算的特点包括以下哪些方面?A.服务可计算B.高性价比C.服务可租用D.低使用度17 .云计算使得使用信息的存储是一个O的方式,它会大大地节约网络的成本,使得网络将来越来越泛在、越来越普及,成本越来越低。A.分布式B.密闭式C.密集式D.共享式18 .数据再利用的意义在于()。A.挖掘数据的潜在价值B.实现数据重组的创新价值C.利用数据可扩展性拓宽业务领域D.优化存储设备,降低设备成本19 .大数据人才整体上需要具备O等核心知识。A.数学与统计知识B.计算机相关知识C.市场运营管理知识D.在特定业务领域的知识20 .下列关于大数据的说法中,错
32、误的是()。A.大数据具有体量大、结构单一、时效性强的特征B.处理大数据需采用新型计算架构和智能算法等新技术C.大数据的应用注重相关分析而不是因果分析D.大数据的应用注重因果分析而不是相关分析三、判断题(每题1分,共30分)1 .人工智能所解决的问题是一般的数值计算或数据处理问题。O2 .第一个人工智能程序设计语言是表处理语言,它于1960年在美国设计实现。O3 .耦合性语言意为将具有规约语义的函数语言和具有归结语义的逻辑型语言组合在一起,并在两者间提供接口。O4 .归结原理除了能用于对已知结果的证明外,还能用于对未知结果的求解。O5 .自然语言理解包括语音理解和文字理解。()6 .确定性理论
33、是一种精确推理模型。()7 .成立中央网络安全和信息化领导小组,体现了我们党对网络安全强有力的领导和更加高度的关注。O8 .大数据是用来描述在我们网络的、数字的、遍布传感器的、信息驱动的世界中呈现出的数据泛滥的常用词语。大量数据资源为解决以前不可能解决的问题带来了可能性。O9 .大数据是通过传统数据库技术和数据处理工具不能处理的庞大而复杂的数据集合。O10 .与20世纪相比,近年来我国很少遭受网络攻击。()11 .电脑或者办公的内网进行物理隔离之后,他人无法窃取到电脑中的信息。O12 .人们关心大数据,最终是关心大数据的应用,关心如何从业务和应用出发让大数据真正实现其所蕴含的价值,从而为人们生
34、产生活带来有益的改变。()13 .利用数据融合、数学模型、仿真技术等,可以逼近事物的本质,可以揭示出原来没有想到或难以展现的关联,大大提升政府决策的科学性O14 .对于企业来说,给用户进行各种促销或者实施运营策略的时机也比较重要,而且对不同兴趣偏好的用户最好集中处理。O15 .简单随机抽样,是从总体N个对象中任意抽取n个对象作为样本,最终以这些样本作为调查对象。在抽取样本时,总体中每个对象被抽中为调查样本的概率可能会有差异。O16 .决策树是一种基于树形结构的预测模型,每一个树形分叉代表一个分类条件,叶子节点代表最终的分类结果,其优点在于易于实现,决策时间短,并且适合处理非数值型数据。O17
35、.具备很强的报告撰写能力,可以把分析结果通过文字、图表、可视化等多种方式清晰地展现出来,能够清楚地论述分析结果及可能产生的影响,从而说服决策者信服并采纳其建议,是数据分析能力对大数据人才的基本要求。O18 .一般而言,分布式数据库是指物理上分散在不同地点,但在逻辑上是统一的数据库。因此分布式数据库具有物理上的独立性、逻辑上的一体性、性能上的可扩展性等特点。O19 .数控机床电气控制系统的发展与数控系统、伺服系统、可编程序控制器发展密切相关。O20 .数控机床一个主程序中只能有一个子程序。()21 .数控机床按控制系统的特点可以分为开环、闭环和半闭环系统。O22 .数控机床伺服系统是以机械运动速
36、度为直接控制目标的自动控制系统。O23 .数控机床适于单件、小批生产形状复杂的工件,不适合大批量加工。()24 .数控机床采用滚珠丝杠传动没有反方向间隙。()25 .高速主轴动力学性能及稳定性对高速加工起着关键的作用。()26 .对于大型、中等、小型规模的公司而言,大数据对中等规模的公司帮助最大O27 .人工智能本身是一门综合性的前沿学科和高度交叉的复合型学科,研究范畴广泛而又异常复杂O28 .人工智能是科学交叉的结果,它由不同领域多学科综合发展而来。()29 .图灵测试存在的潜台词是机器智能的极限可以超越人的智能,机器智能可以不与人的智能可比拟O30 .迁移学习是一种机器学习的方法,指的是一
37、个预训练的模型被重新用在另一个任务中。O2023年全国工业和信息化技术技能大赛工业大数据算法赛项2023年8月一、大赛内容、形式和成绩计算1(一)竞赛内容1(二)竞赛形式1(四)成绩计算1二、大赛命题原则1三、大赛范围、赛题类型和其他1(一)理论知识竞赛11.赛题范围2(1)工业大数据2(2)工业人工智能算法2(3)智能制造技术2(4)信息安全法律法规22 .赛题类型23 .竞赛时间24 .命题方式25 .考试方式3(二)实际操作竞赛31 .竞赛范围与内容3(1)硬件设备搭建4(2)图像训练数据采集5(3)工业视觉模型训练与部署5(4)误差补偿算法模型训练与部署5(5)模拟生产验证52 .比赛
38、时间63 .命题方式6四、大赛设施6(一)大赛平台6(二)耗材6(三)工具、仪器7(四)选手防护装备7(五)其他7五、大赛评分标准制定原则、评分方法、评分细则及技术规范8(一)评分标准制定原则8(二)评分方法81.基本评定方法82.相同成绩处理8(三)评分细则(评分指标)81 .理论知识部分评分82 .实际操作部分评分8六、大赛硬件平台说明14(一)赛项硬件平台141 .智能加工模块152 .智能视觉检测模块163 .工控机及周边设备17(二)赛项软件平台171 .云端算法软件172 .本地端应用软件20一、大赛内容、形式和成绩计算(一)竞赛内容本赛项内容包含理论知识和实际操作两部分。(二)竞
39、赛形式本赛项为双人团体赛,分为职工组(含教师)和学生组两个组别。(四)成绩计算理论知识竞赛满分为100分,按20%的比例折算计入竞赛总成绩。赛题均为客观题,采用机考方式实现。实际操作竞赛满分为100分,按80%的比例折算计入竞赛总成绩。折算后的理论知识竞赛成绩与实际操作竞赛成绩相加得出参赛选手竞赛总成绩,满分为100分。二、大赛命题原则在命题方向上,聚焦新一代信息技术与制造技术深度融合领域,以解决工业大数据应用实际需求为命题方向,设置算法赛题。在考核重点上,考核工业大数据算法等基本技能的同时,重点突出企业所需专业技能及新技术应用。重点考察参赛选手构建大数据算法模型实现问题解析、数据处理、特征工
40、程、模型构建、训练优化的能力和技术水平,以及对智能制造系统原理的掌握程度。三、大赛范围、赛题类型和其他(一)理论知识竞赛1.赛题范围以工业大数据和工业人工智能算法应用知识为主,智能制造技术、数据信息安全法律法规等相关知识为辅。(1)工业大数据工业大数据平台架构(数据架构、数据技术架构、应用平台架构)、数据分析概述、数据收集与导入、数据清洗与预处理、数据挖掘基础、主成分分析、分类器与决策树、聚类思想与建模、神经网络思想与建模、深度学习基础。(2)工业人工智能算法神经网络思想与建模、深度学习基础、工业人工智能算法的选择与应用,机器视觉理论基础与框架、图像分析基础和图像变换、图像预处理、边缘检测与轮
41、廓表示。(3)智能制造技术智能制造技术基础、智能制造典型技术、智能制造技术应用、机电一体化基础基本认知、可编程控制器(PLC)基础。(4)信息安全法律法规信息安全相关的法律法规:网络安全法、数据安全法、个人信息保护法。2 .赛题类型赛题分为三种类型:单项选择题、多项选择题和判断题。3 .竞赛时间理论竞赛时间为1小时。4 .命题方式由大赛组委会组织专家组统一命题。5 .考试方式采用计算机考试。(二)实际操作竞赛本赛项的实际操作竞赛突出工业大数据算法在工业生产中的应用,针对数控加工系统中的机器视觉识别准确性和加工精度稳定性问题,通过大数据及人工智能算法,实现智能加工的误差实时补偿。实际操作竞赛以考
42、核工业大数据及工业人工智能算法应用技术技能为主,包括图像数据采集、云平台使用、算法模型训练及优化以及安全文明竞赛等在实际操作竞赛考查。1.竞赛范围与内容为全面考查参赛选手的职业综合素质和技术技能水平,实际技能操作竞赛分为5个环节:硬件设备搭建、训练数据样本采集、工业视觉模型训练与部署、误差补偿算法模型训练与部署和模拟生产验证。具体内容见表Io表1竞赛范围与内容序号内容说明1硬件安装接线1 .数据采集硬件平台安装与调试。2 .智能加工设备基准设置3 .通讯系统建立连接和测试2图像训练数据采集1 .通过工业视觉进行工件训练样本数据采集,并进行数据预处理。2 .采集足够训练使用数量的图片训练集03
43、.样本数据分类保存、云平台存储。3工业视觉模型训练与部署1 .模型训练工具设置,将训练集配置为模型的制定输入参数。2 .优化模型训练方法,选定恰当的激活函数,以及训练参数。3 .在云平台给定环境中进行模型训练,更新迭代模型,并将训练模型进行固化。4 .优化训练算法模型,配置传入参数。5 .配置结果应用,以接口方式输出给设备。4误差算法模型训练与部署1 .设计误差补偿模型,或选定恰当的模型,以及设定训练参数。2 .更新迭代模型,将训练完成的模型进行固化。3 .完成误差实时补偿模型部署。4 .验证误差补偿模型部署效果。5模拟生产验证1 .正确进行产线动作测试、加载补偿算法,通过运动控制单元模拟智能
44、加工进行加工生产验证。2 .补偿参数微调。3 .产线生产效率调整。4 .正确使用防护用具。5 .符合安全操作要求。6 .保持工作区域内场地、材料和设备的清洁。7 .良好的职业素养。实际操作部分由参赛选手按工作任务书的要求完成。具体包含以下工作任务:(1)硬件安装接线根据任务书给定的任务要求,选手进行数控加工装置、工业视觉相关设备测试,包括相机测试、光源环境调试、通讯线路连接、设备基准点设置等Q(2)图像训练数据采集根据任务书给定的任务要求,选手使用视觉系统进行若干工件图像数据采集,以丰富工件样本图像数据库。该环节所采集到的样本图片数据的数量和质量将会直接影响后续的模型训练环节。(3)工业视觉模
45、型训练与部署根据任务书给定的任务要求,选手进行基于数据采集的样本图片进行视觉模型训练,可选择、调用云端已提供的完整模型框架(基于TensorFlow),通过设定相应参数进行模型训练;也允许选手自行搭建视觉模型,上传云端进行训练。训练好的模型能够返回待测工件和标准件的相似度。模型训练完成之后,参赛选手需要将模型部署在服务器上,并且在云平台上进行相关适配。(4)误差算法模型训练与部署根据任务书给定的任务要求,选手基于组委会提供的工件样本图片及对应的工件加工工艺参数数据集,进行误差补偿算法模型的构建。选手需完成数据清洗、模型训练、模型部署等过程。模型训练完成之后,参赛选手需要将模型部署在服务器上,并且在云平台上进行相关适配。(5)模拟生产验证根据任务书给定的任务要求,选手根据组委会提供的加工图纸进行若干个待加工件的生产验证,软件导入加工对象的坐标集,并通过误差补偿算法使加工出的图形补偿干扰因素造成的误差,使加