《XX区智能文库项目采购需求.docx》由会员分享,可在线阅读,更多相关《XX区智能文库项目采购需求.docx(19页珍藏版)》请在课桌文档上搜索。
1、XX区智能文库项目采购需求一、项目概况目前XX区各部门之间的知识、文稿数据都是独立的,无法通过线上形式实现互联互通。有关人员在写作过程中出现诸多问题,如写作的格式不对,写作的文种混乱,写作中的语言不规范等问题。急需一套系统的建设,使线下数据移至线上,突破数据壁垒,实现数据的共享。故本次XX区智能文库的建设,写作台中包含文稿模板、协同编辑等功能,可以帮助有关人员进行单人编辑以及多人编辑,提供智能校对等功能,保证文档的正确率,提高了工作人员的日常办公效率。二、总体要求(一)技术构架要求按照国家电子政务建设的指导意见,为充分保证电子政务平台目具有较高的安全性、跨平台性、易扩展性、易维护性,本次项目基
2、于信创基础软硬件环境,符合信创体系要求。应用层采用基于J2EE的三层(BrOWSer/ApplicationServer/DatabaseServer)应用体系结构。应用SerVIet、EJBXML等编程技术和面向对象程序设计技术,将复杂的业务处理逻辑、流程控制逻辑和数据存取逻辑通过EnterPriSeJavaBeanS组件来实现。软件系统运行于应用服务器之上,实现业务逻辑的快速部署和灵活调整,并通过部署在应用服务器层的专用组件实现对数据库的存取访问,以充分保证数据库系统的安全可靠访问。本次投标产品均需按信创体系要求构建系统开发和运行环境:1.采用多层架构的B/S结构;2 .采用JAVA语言技
3、术,基于J2EE技术的分布式计算技术进行系统架构设计和系统开发;3 .采用WebService技术;4 .支持WindoWs、UNIX以及国产主流操作操作系统;5 .支持WebIogic、Webspheretomcat以及国产主流应用中间件;6 .利用XML作为系统接口的数据交换标准,进行信息资源整合;7 .采用组件技术提供系统的快速开发和更新;8 .采用高性能中间件技术作为基础平台,如政务平台中间件技术、数据访问中间件技术、事务处理中间件技术、安全控制中间件技术等;9 .支持信任与授权服务、基于底层的PKI/PMI证书服务机制和PKI基础安全服务机制,提供符合J2EE规范的可信Web计算平台
4、,该平台提供基于安全XML技术的PKI基础安全服务和PKI/PMI证书服务的统一调用接口。10 .安全检测要求:系统建成后满足等保二级认证。(二)设计原则按照不同业务的特点和信息技术的特点,本项目应遵循“技术先进,实用易用,经济可维护,结构开放,安全稳定”的设计思想,以实际需求为导向,充分满足当前的要求并具有突破性和前瞻性。(1)先进性原则平台在设计思想、系统架构、应用技术上均采用目前最先进的技术、方法、软件等,确保系统有一定的先进性、前瞻性、扩充性,符合技术发展方向,延长系统的生命周期。(2)实用性和易用性原则系统能够满足当前全流程业务工作需求,适应各业务角色的工作特点,易于使用、管理与维护
5、。遵照标准的用户界面设计规范,界面设计友好,智能化水平高,联机帮助方便,操作简洁,具备高可操作性,并且面向不同用户对象,进行针对性开发,为各类用户提供个性化的功能和界面,贴近用户实际应用需要,提高系统的易用性。(3)可维护性原则系统设计标准化、规范化,按照分层设计,软件构件化实现。具有完备的系统维护方案,并建立维护管理系统。系统建成正式使用后只做初始安装,以后的升级及版本调整要能自动维护,定期自动下载安装。(4)经济性原则系统的建设在保证功能、性能指标的前提下,尽可能降低成本,利用现有的资源,按计划在规定时间内实现平台的建设目标。(5)保密及安全性原则平台的网络配置和软件系统充分考虑数据的保密
6、和安全。对用户权限进行严格的设定,包括业务操作权限、图形操作权限、打印输出权限等,对系统的操作有详细的日志记录,确保网络安全可靠地运行。平台能通过定期自动、手工等方式进行数据备份,在保证系统用户权限合法性的同时,保证数据的准确性和平台容灾能力。平台自动对系统异常进行记录和处理,在应用服务器宕机时,不丢失业务数据,且可以对系统错误和数据异常进行明确、友好的提示。(6)可扩展性及可开放性原则系统的设计具有灵活的扩展性和良好的可移植性,采用模块化、组件式设计,具有良好的可扩展接口,充分考虑今后的横向和纵向的平滑扩张能力,实现数据、功能、业务等各方面的可扩展性。平台通过标准接口,可以与各级政府职能部门
7、对接数据,并快速应用于各自的专业系统中,满足业务系统不断变化扩展以及系统容量不断增长的要求。(7)可靠性原则系统运行稳定和可靠,在现有的网络架构、软硬件平台基础上,具备快速处理和大用户量迸发能力。具有较好的健壮性,能容忍非法输入数据、相关软件或硬件组成部分的缺陷或发生异常的情况,能保持继续正常运行。三、采购需求(一)采购清单序号类别系统单位数量1区协同办公平台升级首页升级改造项1与区电子政务综合应用平台对接项1常用工具复用项1会议管理升级项1三方系统集成项12基础支撑体系统一用户体系集成项1统一身份认证集成项1统一消息服务集成项1在线预览服务集成项13智能文库系统智能文库首页套1写作台套1数据
8、库维护套1系统管理后台套1数据采集套1数据仓建设套14X政钉桌面端建设X政钉桌面端应用项15其它内容语音转文字年1语音播报年1Wps编辑器年1第三方功能测评项1(二)总体架构本项目整体需要按照“四横四纵”架构进行一体化设计,“四横”分别是业务应用体系、应用支撑体系、数据资源体系和基础设施体系;“四纵”分别是政策制度体系、标准规范体系、组织保隙体系和安全保障体系,包含如下内容:总体框架从下到上由基础层、数据层、支撑层、业务层及展示交互层组成,所有层次始终按照安全保隙管理体系和标准规范及运行管理进行建设。基础层:提供最基本的系统运行环境,包括基础网络、服务器、基础设备等。在这里主要是利用现有的基础
9、网络、硬件资源,保证系统的正常运行。数据层:构建数据库,包括基础数据库、文档库、专家库等,为数据分析提供数据清洗、数据处理、数据关联等能力服务。支撑层:为系统提供基础支撑服务,包括统一用户体系、统一身份认证、在线预览服务、统一消息服务等。业务层:系统功能的实现,主要包括智能文库首页、写作台、数据库维护的多项功能。通过以上统一、完整的系统层次架构,把系统各种分布式应用系统和网络资源完整地组织在一起,形成相互数据沟通、相互服务调用、相互业务协同的无缝结合。(三)软件系统功能需求1.区协同办公平台升级序号功能模块功能描述单位数量1l协同首页升级改造在原有基础上对区协同办公平台首页进行业务改造,精简操
10、作步骤,简化操作流程,优化页面结构,并融入常用工具项1办公平台升级项,使操作更加简便,内容简洁明了。2与区电子政务综合应用平台对接实现智能文库系统集成在区协同办公平台中。项13常用工具复用在智能文库中开发的常用工具,在OA系统中进行复用。项14会议管理升级新增会前反馈参会人员后,自动给参会人员添加X政钉日程,会前1小时提醒;会中一会一签到二维码,通过X政钉扫码获取参会人员签到时间、签到地点信息。扫码的同时,自动判断当前X政钉账号是否为反馈的参会人员,若不是,需填写代会信息;对会议未签到人员一键催到;会后可导出会议参会情况统计的功能。项15三方系统集成根据要求,相似应用系统进行整合。系统提供标准
11、的APl接口(RESTfulAPKWebServicc、本地接口)以帮助实现与第三方系统的集成对接。项12.基础支撑体系序号功能模块功能描述单位数量1基础支撑体系统一用户体系集成集成统一用户体系,包括政务外网X政钉,集中实现各级各单位用户信息、凭证、组织机构等信息与统一用户体系保持一致。项12统一身份认证集成集成基于统一身份认证体系,实现对用户身份标识,有效区别不同类型的用户,提供基于可靠访问控制的“一点登录、项1多点漫游”功能,用户只需一次登录就可以访问授权范围内系统的模块访问权限。3统一消息服务集成集成统一的消息处理服务,根据统一消息服务提供统一代办服务,向统一消息推送入口推送信息,内容主
12、要包括X政钉工作通知、短信。项14在线预览服务集成集成在线预览服务,支持包括文本文件:doc、docxxlsxlsxppt、pptx、dpset、WPs、eiotxt、uot,版式文件:pdf、Ofd、html,图片文件:png、jpgjpegsjpebmp、gif、tiftiff,压缩文件:zip、rartar,音视频文件:MP3、MP4、wav.flv,方便用户在系统平台快捷阅读文档内容。在线阅读保持文档原版原式,实现跨平台阅读以及浏览器无插件阅读,可减轻系统内容管理过程中排版及校对工作量。项13,智能文库系统序号功能模块功能描述单位数量智能文库首页个人配置个人账号能够对自己文库内推荐的文
13、档材料排序的优先级进行配置,支持按照地域、领导、时间等优先级动态调整。项11要情分析要情总览通过首页进入要情分析得更多页面,为用户展示国内各地的要情动态,如总书记、党中央、国务院及兄弟省市党报公开报道等,按照总书记,党中央、国务项1院,各省份展示要情信息查看要情系统以列表的形式展示要情信息,展示内容包括时间、标题、标签,按照发布的时间顺序或者重要程度进行排序。用户可以选择想要查看的要情,包括总书记,党中央、国务院,各省份的要情。查看详细内容,具体展示要情内容,标题、标签、发布人、发布时间、要情内容、要情热词。系统支持展示结构化标签。学习园地文章列表学习园地文章列表查询,持按照分类展示列表,并通
14、过列表展示各个类型下的最新上传的文章,列表支持按照上传时间排序。列表提供通过关键字搜索功能,可搜索对应的文章。项1新建文章学习文章新建,选择文章类型,填写文章内容、标题、出处、关键词、摘要等,支持上传原文件、讲解音频以及其他类型的附件。文章正文信息通过文本编辑器进行在线编辑,编辑完成后通过上传进行文章的发布。查看文章文章查询,提供学习文章的详细信息查看功能,通过列表点击进入文章详情页面,对文章的详细信息及文章的评论信息进行展示,对所有用户提交的评论进行共享。文章对应的附件信息提供查看与下载功能。评论文章文章详情页面提供在线评论功能,用户输入个人评论观点进行发表,发表的评论在评论列表的最顶端展示
15、。常用工具智能机器人智能机器人是一种基于自然语言处理(NLP)技术的聊天机器人。它是集成市场主流的OpenAI开发,可以用于多种应用场景,如自动对话,聊天机器人。项1OCR识别基于人工智能能力与文字识别技术,按照图像输入、图像预处理、版面分析、字符切割、字符识别、图像后处理的操作步骤,结合图像分类、图形矫正、图像增强、子图切割等算法模型,实现针对pdfofddocxdocwps图片等格式文档的解析和读取。智能校对建设智能校对模型,提供智能校对功能,通过上传文件,系统对上传文件进行智能校对,系统自动对文件中的内容进行错别字分析、语义分析,展示校对结果信息,可定位到文档中错误位置,并对分析出来的错
16、别字进行智能推荐,用户通过纠错列表选择是否替换文章中的错别字,降低用户在写作过程中的错字,错词率,提高在线写作的文稿质量与写作效率PDF转Word系统提供PDF转Word功能,支持上传PDF文件,系统会根据PDF智能语音检索结合智能机器人、智能检索、语音转文字和语音播报功能,提供高效智能的语音检索功能。通过语音输入文字,利用智能机器人、智能检索优势,通过快速检索算法,语音播放检索结果。规范性文件智能审查建立针对法律法规、规范性文件的智能审查模型,提供依据法律法规、规范性文件的审核要点的智能审查功能。通过文件上传,系统对上传文件进行智能审查,展示审查结果。减少审查过程中人工干预,全面提升审查时效
17、、审查质量。知识共享知识导航用户可以使用知识导航快速定位和进行知识预览,提供文件搜索和文件筛选等功能,如选择文库、文件分类等功能,对文件进行筛选,通过搜索文件标题,搜索并定位指定的文件进行浏览。项1知识预览知识预览可以在线预览各类文件的原文,查看知识详情。支持预览知识文件的基本信息,如发布单位、发布人、发布时间。支持预览知识文件的结构信息,结构信息包括文件信息、文件要素、基本信息。支持预览知识文件的文件信息,文件信息包括文件标题、字体大小修改、文件标签、文件内容、文件分类。任务模块任务展示以列表的形式展示所有的任务,可选择分类展示任务,分类为全部任务、起草、统稿、送签、完成等项1新建任务提供任
18、务新建功能,输入任务名称、负责人、结束时间、任务内容、附件上传、新建专班。任务新建成功后,会给专班内的人员发送钉消息贡献指数图表展示以图表形式展示年度、季度、月度的省直、区县各部门知识共享、集智共创、能力共建、综合贡献数值项1列表展示以图表和列表形式展示年度、季度、月度的省直、区县各部门知识共享、集智共创、能力共建、综合贡献数值料能检索基础搜索支持按照文章标题、正文、附件内容进行匹配,匹配方式支持全部匹配、部分匹配。并对所有搜索词进行分析,提供搜索热词的展示项1历史检索对用户的搜索关键词做历史记录并去重,在检索时提供用户做参考智能高亮在数据联想、数据命中返回时对已命中的数据进行高亮显示智能标签
19、对每条结果进行标签展示,标签可自定设置,也会根据点击次数、属性等生成,展示的标签包括文章分类标签和结构化标签,并支持按照标签快速查询定位热门检索通过对所有用户搜索关键词的汇总,得出权限内的指定数量热门数据,为用户提供大家最新关注的文稿参考智能联想依据用户的输入历史和文本智能关联算法,对输入文本的智能联想补全搜索结果搜索结果按照默认排序进行展示,提供时间正序、时间倒序等排序方式一站式应用管理从数据源配置到检索规则,从搜索设置与统计分析,实现对内容的全面管理集专班组建根据任务创建专班,对专班进行管理项1智共创专家智库用户可自行选择智库分类,查看不同分类的专家智库2写作文稿列表列表展示文稿任务,包括
20、文稿任务的标题、创建人、负责人、创建时间等,并支持文稿导出、删除等操作。项1文稿起草写作编辑器提供在线写作能力,用户通过编辑器进行在线写作。在写作的过程中编辑器提供一系列的基础辅助功能。如格式调整,字体字号,文字段落颜色设置等基础功能。项1文稿模板模版生成通过模型算法创作写作模板是一种利用人工智能(AI)技术帮助提高写作效率和质量的方法项1模板管理系统提供文稿模板,支持按照分类查看不同的文稿模板启用模板模板启用功能,对用户启用的模板自动填充到编辑器中,用户根据个人需求对编辑器中填充的模板信息进行二次编辑模板收藏模板收藏功能,对模板库中的模板用户可以进行收臧,收藏后的模板会在个人收藏模板中展示协
21、同编辑写作编辑器提供在线写作能力,用户通过编辑器进行在线写作。编辑器支持协同编辑,文章内容可多人同时编辑,支持编辑进行信息留痕,通过消息推送的方式进行编辑信息同步,用户接收到有新的改动可进行信息同步,也可通过在编辑完成保存时进行内项1容对比。参考文献结构化文档查询支持查询结构化文档,查询条件包括文章标题、结构化内容、结构化标签,并支持自定义排序,实现快速便捷搜索到想要的内容项1全文查询支持全文查询,查询条件包括文章标题、正文内容、文章分类、附件等,并支持自定义排序,实现快速便捷搜索到想要的内容一键引入把搜到的参考文献直接引入到文档,包括结构化文档和全文文档一键排版系统提供一键排版功能,对全文按
22、照预设的格式自动排版,一份精美的排版文章就出来了。让你将宝贵的时间用在创作上,用工具提高排版效率。项1一键移交系统提供一键移交功能,在科室人员交接时,可以将该账号下的所有文稿一键移交给对应的人员。项1智能大纲智能大纲能够自动识别WorC1、WPS中的标题和段落结构,记录文字的层级关系和位置信息,梳理并建立文档目录体系。项1存档用户在写作过程中支持多版本存档,避免有时候在未知原因下用户设备关闭,或是不小心退出,造成正在使用的文档丢失的情况,这个功能有效地避免了此类事故的发生。项13数据数据数据录入支持用户手动上传文献,并支持对文献智能分类以及结构化识别,信息录入完项1库维护归集成之后送领导审核,
23、审核通过可以共享查看。数据列表展示所有录入的文章,包括审核状态,显示内容包括资料标题、数据来源、关联标签、文件发布时间、状态、常用操作等。智能分类通过基于政务场景的多维度标签体系对政务文本进行分类标注,使用RoBERTa/BERT+TextCNN算法,提供与政务场景高度契合的智能标签分类能力,按照原始库知识库设定的标签进行智能打标分类。通过构建文稿智能分类算法,形成各类文稿类型的知识体系,针对文稿检索过程中遇到的文件检索、内容检索、关键词组检索、语义检索等文稿检索等难题,构建文稿智搜系统,实现海量文稿的智能化、便捷化检索。智能结构化打标通过XLNet/BERT+Ml-Transformer+C
24、RF模型,对文章或长文本中的特定指标如要件、要素进行识别提取。在数据处理阶段,以字为文本最小特征,并聚合为句子特征以句为单位送入模型学习。在模型构建阶段,构建XLNet/BERT+Ml-Transformer+CRF模型学习文本特征,其中,XLNet/BERT用于提取文本词嵌入特征,再使用Ml-Transformer对特定要件要素的特定指标进行多层次的语意提取。最后CRF用于为预测标签添加约束,提升预测标签的合理性。在模型学习阶段,CRF损失函数由两部分组成,真实路径的分数和所有路径的总分数。随着训练过程的迭代XLNet/BERT+Ml-Transformer+CRF模型的参数值将不断更新,使
25、得真实路径所占的比值越来越大,当真实路径占比达到一定程度不再增加,保存当前参数作为最佳模型。在最终的模型预测阶段,根据文本中各句子在各类别概率值确定各句所属类别,并将同一种类型且连续的句子确定为同一类型。实现在政务文本中对要件、要素等业务特征进行提取。草稿箱对一些录入的文档还没有补充好所有信息,点击保存会暂存到草稿箱,后面可从草稿箱直接打开继续编辑完善。待办事宜对一些录入好的文档点击送审核,待审核的文稿会在待办事宜展示,指定的处理人可以看到待办事宜,并点击进去处理,审核通过之后,文稿会同步部门共享。分类管理分类列表展示文献标签,主要包括三大类:原始库、知识库、结构化标签,目前默认维护标签近百个
26、,可根据用户需求进行调整。展示内容包括标签名称、标签路径、提出人、状态、启用禁用等常用操作。项1待办事宜对标签进行调整,包括删除、修改、添力口,都会生成一条待办事宜,会有相应权限的用户进行审核,审核通过标签才可以使用。专家智库智库维护后台维护智库信息,包括智库名称、类型、负责人、首席专家、联系方式等,并支持新增、编辑、删除等操作。项1智库联盟维护后台维护智库联盟信息,包括智库联盟名称、牵头单位、牵头单位负责人、联系方式等,并支持新增、编辑、删除等操作。后台维护常用的系统手册,方便用户和手册管理三方更快的了解系统,手册维护的信息项1包括手册的标题、适用范围、附件等。系统用户管理实现对系统中的组织
27、架构和机构人员全方位的管理。项14管理后权限管理通过权限的设置,统一对系统中的各个应用进行权限的设定,提供灵活统一的模块组织管理与配置功能;实现模块、项1台子模块、视图等多层次的访问权限控制。网站配置配置需要采集的网站,包括网站名称、地址、是否启用代理。项1配置页面名称、解析类型、请求方式、数据采集采集酉己详情页解析配置列表页路径等,并配置标题解析路径、来源解析路径、发布时间解析路径、内容解析路径等解析规则。项15置存储配置配置存储名称、存储类型、存储路径等,实现无侵入式修改,实时生效。项1采集任务配置配置任务名称、站点名称、任务调度有效时间、任务调度时间及频率等。项1自动采采集政治要情数据采
28、集政治要情数据涵盖XX省内及一二线城市的政治要情数据,并定时采集,可后台配置,同时支持客户需求新增采集项1集数据站点。采集政策法规数据采集政策法规数据涵盖XX省内及一二线城市,并定时采集,包括政策文件附件,可后台配置站点和采集频率,同时支持新站点后端配置。项1采集专题数据涵盖十四五规划和二十大相关专题数据,可满足用户需求支持新站点后端自定义配置。项1方对接主动抓取三方如支持数据库信息提供,采集系统通过配置可自动定时抓取数据,对采集内容通过OCR自动识别与内容提取,通过建立多层数据仓实现对多源头数据的规范化、标准化管理。项1接口对接提供统一的对外数据API接口,三方通过接口进行数据对接。第三方异
29、构业务系统的数据,按照平台的统一标准,进行采集汇聚,消除系统之间的数据鸿沟,实现架构系统数据统一。项16数据仓建设命名规范常见的几种类型的表的命名规范,包括ODS层、DM)层、DWS层、ADS层项1数据抽取通过根据XX智能文库的数据资源进行调研,并按照数据结构大体分为结构化数据,半结构化数据,非结构化数据三大类,按照数据源接入类型分为网络爬取,第三方系统接入,手工录入等。项1构建ODS层通过将数据抽取至智能文库数仓后,来构建ODS层(原始数据层),为了考虑后续数据追溯这一层原封不动地接入原始数据,ODS层中的表命名需要遵循上述命项1名规范。数据清洗构建DWD层需要针对数仓中的数据进行简单的清洗
30、,其中包含针对必填列的非空校验,去重,过滤等操作。构建DWD层通过上述按照一定的规则进行数据清洗后,相对于ODS层,清洗出来的数据已经基本属于标准化完整的数据。此时,可以按照上述命名规范建立标准的数据目录,并形成标准的主题库,例如领导讲话库,批示指示库,政策文件库,规范方案库等等。项1数据打标针对DWD层需要实现初步的数据关联,从而为DWS层做准备,并形成以“重大专题库”,“基础知识库”等核心的标准数据,同时可以针对不同场景下的同一类数据运用人工智能的能力进行打标签,并将存储智能打标结果或人工打标结果记录到DWD层的表中。最终形成带有标签的标准的数据,可以直接提供至上层应用系统进行分类搜索,简
31、单的按照标签分类可以精准地定位到某一标签下的数据,通过结合NLP的语义分析,可以实现数据自动标签化的效果,从而为上层应用智能文库提供数据支撑。项1构建DWS层经过数据打标的过程,在DWS层形成的数据已经汇总成能够分析某一个主题域的数据服务层,一般是宽表,用于提供后续的业务查询,OLAP分析,数据分发室项1构建ADS层构建完DWS层后,后续需要针对特定的业务结合特定的场景,再次通过数据打标来产生各个主题库的数据,此时形成的数据层,则为ADS层。从而为智能文库提供结构化的专题知识库。项14X政钉桌面端建设X政钉桌面端应用,将智能文库系统功能完整迁移至X政钉中。通过X政钉账号实现在桌面端的一键登录,
32、解决在非政务网环境的日常办公需要。(四)服务及其他需求1、语音转文字,系统支持多场景的语音转文字能力,减少用户输入的工作量,前端通过识别接口输入到在线编辑器中,支持识别内容的保存和导出。提供1年语音转文字服务。2、语音播报,系统提供播报功能,根据语音朗读文本中的内容进行播报。语音朗读文本有两种形式,一是上传文档,二是手动编辑文本。通过语音合成能力,进行语音在线播报,减少用户对文章的阅读工作量。3、wps编辑器,提供1年wps在线编辑服务。4、针对本项目系统,提供第三方功能测评。四、项目建设周期合同签订后3个月内完成,其中建设工期为2个月,试运行1个月。详细实施进度要求如下:K合同签订后10天内进一步优化需求分析、概要设计、详细设计,并细化系统建设计划、目标任务书和测试验收方案,向采购人提供上述文档并需经采购人审查通过;2、合同签订后2个月内完成项目的全部系统建设并通过初步验收,进入试运行;3、1个月完成培训、试运行及相关的修改,经验收合格,正式交付使用。