软件需求规范.docx_课桌文档desk33.com

资源描述

《软件需求规范.docx》由会员分享，可在线阅读，更多相关《软件需求规范.docx（24页珍藏版）》请在课桌文档上搜索。

1、Windows语音助手软件需求阐明书文档编号：DOi版本号：VI.1编写：编写日期：校对：校对日期：FirstDreamTeam团体开发人员开发单位：青岛大学FirstDreamTeam团体项目负责人:令文档修改记录修改人修改时间版本号备注*2023-6-20VI.0初次编写*2023-6-30VI.1调整需求，重点强调项目功能需求*2023-7-10VI.3细化需求，重新调整文档构造。*2023-8-1V1.4统文档构造。目录一.引言错误!未定义书签。1.1 编写目的错误!未定义书签。1.2 项目背景错误!未定义书签。1.3 定义错误!未定义书签。1.4 参照资料错误!未定义书签。二.任务概

2、述错误!未定义书签。2.1 语音识别技术的来源与发展前景错误!未定义书签。语音识别技术简介错误!未定义书签。语音识别技术的应用错误!未定义书签。语音识别技术的发展错误!未定义书签。2.2 功能简介（目的J）错误!未定义书签。2.3 3顾客的特点错误!未定义书签。2.4 4运行环境错误!未定义书签。硬件环境错误!未定义书签。软件环境错误!未定义书签。2.5 条件与限制错误!未定义书签。2.6假设与依赖错误!未定义书签。三.大赛项目规定（功能需求）错误!未定义书签。3.2功能需求实例图错误!未定义书签。3.2功能需求流程图错误!未定义书签。3.2功能语音识别与输入错误!未定义书签。功能阐明错误!未

3、定义书签。功能描述错误!未定义书签。3.3功能二一一屏幕取词错误!未定义书签。功能阐明错误!未定义书签。功能描述错误!未定义书签。3.4功能三一一语音控制错误!未定义书签。功能阐明错误!未定义书签。功能描述错误!未定义书签。3.5功能四一一语音精灵错误!未定义书签。功能阐明错误!未定义书签。功能描述错误!未定义书签。3.6功能五一一语音朗诵(TTS)错误!未定义书签。功能阐明错误!未定义书签。功能描述错误!未定义书签。四.运行规定错误!未定义书签。4.1顾客界面错误!未定义书签。4.2硬件接口错误!未定义书签。4.4通信接口（无）错误!未定义书签。一.引言1.1 编写目的该文档对所开发的Win

4、dOWS语音助手抵达功能、性能、顾客界面及运行环境等作出了详细的阐明。他作为对该系统概要设计的根据，协助开发人员理解本系统的框架思想及实现功能，并验证核算该产品能否满足顾客规定的原则，便于技术文档和需求变化的管理。同步也是顾客与开发人员双方对软件需求获得共同理解的基础。预期读者：大赛评委、项目投资商、产品顾客、开发人员，指导老师。1.2 项目背景- 系统名称：Windows语音助手- 任务提出者：- 开发者：青岛大学FirstDreamTeam团体。- 面向顾客：1、但愿可以借助语音系统愈加紧捷、以便的操作电脑的顾客。2、无法很好运用鼠标或键盘对电脑进行操作的残障人士顾客。特此申明：此软件R勺

5、开发作为后期商业项目的原型，均采用授权开发工具，产品拥有自主知识产权，未经容许不得随意传播或使用。1.3定义 SDK：SDK就是SoftwareDevelopmentKit的J缩写，中文意思就是“软件开发工具包”。这是一种覆盖面相称广泛的名词，可以这样说：辅助开发某一类软件的有关文档、范例和工具的集合都可以叫做“SDK”。 TTS全称为：TeXlToSPeeCh即文本合成语音，此为SAPl的基本类型之一，TTS可以将文本中的字符或文档合成为语音并“说出来。 SR全拼：SpeechReCOgniSC即语音识别，此也为SAPl的基本类型之二，SR则可以把人说话的语音转换为易读的字符或文档。 SAP

6、ISAPl又称语音应用程序编程接口，它减少了语音识别和语音合成应用中的程序代码，使得语音技术在广泛和蓬勃发展的实际应用中更轻易使用。SAPl使得应用程序和语音引擎之间高度紧密的结合。SAPl可以实时处理多种语音引擎在底层工作中的细节。SAPT包括文本合成语音应用程序接口，语音识别应用程序接口。SAPl的两种基本类型是文本合成语音(TTS)引擎和语音识别(SR)引擎。WindowsAPI(Win32APl)WindowsAPI是一套用来控制Windows的各个部件(从桌面的外观到为一种新进程分派的内存)的外观和行为的一套预先定义於JWindoWS函数.顾客的每个动作都会引起一种或几种函数的运行以

7、告诉Windows发生了什么.APl函数包括在Windows系统目录下的动态连接库文献中(如User32.dll,GDI32.dll,Shell32.dll.).1.4参照资料1.大赛题目设置Windows语音助手的有关详细规定。2.参照书籍：令语音识别与控制应用技术刘幺和，宋庭新编著出版社：科学出版社出版时间：2023-2-1令新编APl大全2023版QMicrosoftMSDNMicrosoftSpeechSDK5.1HelpC#开发技巧大全中国水利出版社令C#数据安全手册人民邮电出版社令C#高级编程-清华大学出版社令国标软件产品需求规格阐明书国标可行性分析汇报软件工程作者：曾建潮IS

8、BN：出版社：武汉工大出版日期：2023-5-1软件工程与软件文档写作作者：文斌，刘长青，田原编著ISBN:2,出版社：清华大学出版社出版日期:2023-8-1令软件需求工程作者黄国兴周勇出版社清华大学出版社书号302-16860-7出版时间2023年4月字数千字二.任务概述项目最终采用最新微软.NET技术，并结合微软最新语音识别引擎，通过语音输入抵达对计算机的基本控制。本项目在ViSUaIStudio2023集成开发环境下开发，基于.NET及Speech语音引擎平台。给客户带来以便快捷的全新体验。2.1 语音识别技术的来源与发展前景语音识别技术简介智能翻译机、语音拨号、语音查询、语音自动定票

9、系统、语音工业控制等等，可以想见，凡用计算机的地方都会有语音识别。在计算机辅助教育方面，计算机就成为专业的家庭辅导教师；在幼儿进行启蒙教育的玩具中，语音识别也将倍受欢迎。电脑语音合成技术即CTI(COmPUterTelePhOnelntegration),是用计算机技术处理语音。一般是建一种信息呼喊中心，顾客打来时计算机会自动地一层层地转给有关部门，一直到为顾客处理问题为止。有的语音信箱可以支持不同样语种。CTI并非新技术。与网络把数据压缩打包进行传播有所不同样，CTl究竟还是一种语音模拟传播技术，只不过用上了计算机对语音进行智能管理而己。发达国家早几年就普及了这项应用，”是个机构就有呼喊中心

10、”，以保证客户或合作伙伴打来的每一种均有回应。中国却还没有走到这一步，目前除了电信部门普遍开通了“呼喊中心”服务之外，大多数企业还刚刚起步。这个差距反应了管理和竞争意识方面的问题。中文语音浏览器产品“Interversa”使我们可以用“嘴”遨游互联网实现了“所说即所得“。Interversa已针对PentiUmlll的SSE指令集进行了优化，并将在PentiUmin上实现最佳的性能和识别率。常见的语音识别系统尚有“命令和控制(COmmand&Control)”(是持续的，拥有小词汇量和独立扬声器)、“语音导航、微软的“不持续听写(DiSCreteDiCtation)”(是不持续、大词汇量和非独

11、立扬声器的I),IBM及)ViaVoice则属于持续听写。语音识别技术就是让机器通过识别和理解过程把语音信号转变为对应的文本或命令的高技术，也就是让机器听懂人类的语音。也就是说，假如电脑配置有“语音辨识”的程序组，那么当你的声音通过一种转换装置输入电脑内部、并以数位方式储存后，语音辨识程序便开始以你输入的声音样本与事先储存好H勺声音样本进行对比工作。声音对比工作完毕之后，电脑就会输入一种它认为最“象”的声音样本序号，就可以懂得你刚刚念的声音是什么意义，进而执行此命令。说起来简朴，但要真正建立辨识率高的语音辨识程序组，却是非常困难而专业的，世界各地的学者们也还在努力研究最佳的方式。专家学者们研究

12、出许多破解这个问题的措施，如傅立叶转换、倒频谱参数等，使目前的语音辨识系统已抵达一种可接受的程度，并且辨识度愈来愈高。本项目是一种基于语音识别的一种智能化服务产品，是面向服务设计的成功案例之一。语音识别技术的应用语音识别技术的应用重要有如下两个方面。一是用于人机交流。目前这方面应用的呼声很高，由于使用键盘、鼠标与电子计算机进行交流的这种方式,使许多非专业人员，尤其是不懂英语或不熟悉汉语拼音的人被拒之于门外,影响到电子计算机的深入普及。语音识别技术的采用，变化了人与计算机的互动模式,人们只需动动口，就能打开或关闭程序,变化工作界面。这种使电脑人性化的成果是使人的双手得到解放，使每个人都能操作和应

13、用计算机。仍是目前使用最为普遍的通信工具,通过与语音识别系统的协同工作，可以实现语音拨号、购物以及通过办理银行业务、炒股、上网检索信息或处理电子件等。很快,能按主人口令接通、打开收音机，以及通过声纹识别来者身份的安全系统也将获得应用。语音识别技术的另首先应用便是语音输入和合成语音输出。目前，已经出现能将口述的文稿输入计算机并按指定格式编排的语音软件,它比通过键盘输入在速度上要提高24倍。装有语音软件的电脑还能通过语音合成把计算机里的文献用多种语言“读”出来,这将大大推进远程通信和网络的I发展。在现阶段,语音技术重要用于电子商务、客户服务和教育培训等领域,它对于节省人力、时间,提高工作效率将起到

14、明显的作用。能实现自动翻译Fl勺语音识别系统目前也正在研究、完善之中。语音识别技术的发展语音识别技术是2023年至2023年间信息技术领域十大重要的科技发展技术之一。它是一门交叉学科，正逐渐成为信息技术中人机接口的关键技术。语音识别技术与语音合成技术结合使人们可以甩掉键盘，通过语音命令进行操作。语音技术的应用已经成为一种具有竞争性的新兴高技术产业。与机器进行语音交流，让机器明白你说什么，这是人们长期以来梦寐以求的I事情。语音识别技术就是让机器通过识别和理解过程把语音信号转变为对应的I文本或命令的I高技术。语音识别是一门交叉学科。近二十年来，语音识别技术获得明显进步，开始从试验室走向市场。人们估

15、计，未来23年内，语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。语音识别听写机在某些领域的应用被美国新闻界评为1997年计算机发展十件大事之一。诸多专家都认为语音识别技术是2023年至2023年间信息技术领域十大重要的科技发展技术之一。语音识别产品将是继、计算机、Intemet之后信息产业界的又一次革命。假如我们可以突破人机交互的瓶颈，就能使任何人都可以对计算机“发号施令”，口授文章，甚至“亲切交谈”，真正全面地实现“君子动口不动手”的人机交互方式。正是这充斥潜力FI勺市场前景使世界上某些著名企业无不看重“语音识别”这块正待开发的市场，IBMDragon

16、InteKMicrosoftPhilipsMotorolaAppleNationaLNOrtel等大企业都设有专门的语音识别技术研发部或子企业，每年投入的研究经费达数千万美元。Intel企业推出欧JPentiUm山为语音产品的实时化提供了深入的保证。反过来，语音产品的发展也将为半导体工业提供新的契机。在国际市场上，由于中国的国际地位与日俱增以及在经济和市场方面所处的重要地位，汉语语音识别越来越受到重视；各大企业都相继投入到汉语语音识别系统的开发中，其投资也在逐年增长。日渐火爆WJ语音市场再一次给我们带来了机遇和挑战；不停涌现和日新月异的新产品将证明，语音识别产品是继、计算机、Imernet之后

17、，信息产业界的又一次革命。2.2 功能简介（目的）本系统的重要功能是实现顾客通过语音来进行对系统的操作以及完毕对系统资源的控制与使用，使我们可以用“嘴”遨游互联网实现了“所说即所得。讲的通俗一点，就是顾客“说话”来操纵电脑，省去使用鼠标，键盘In麻烦了。此外，还可以协助顾客“读”文本，实现文本到语音的转换，同样免除顾客长期用眼看资料的劳顿。本产品实现了人机交互的功能,就能使任何人都可以对计算机“发号施令”,授文章，甚至“亲切交谈”，真正全面地实现“君子动口不动手”的人机交互方式。为顾客操作windows系统提供一种更智能，更人性化的操作方式，通过语音来完毕WindOWS基本操作，使顾客有一种亲

18、切於J感觉。为顾客操作系统带来一种耳目一新，以便、快捷的感受，语音的控制使顾客办公及基本操作抵达事半功备的效果。愈加新奇的操作界面（语音精灵的加入）能使顾客在操作过程中抵达一种娱乐的效果。2.3 顾客的特点该语音系统既可使深入理解WindoWS基本操作的顾客操作起来愈加紧捷、以便，也可对初步有WindOWS操作知识的顾客深入学习电脑知识有辅助效果，使其学得更快。总体来讲本系统合用的顾客范围较广，只要具有一点电脑知识的顾客都可以顺利的应用本系统。2.4 运行环境硬件环境CPU：2.2GHZ或更快；内存：512MB或更大的内存；硬盘：7200RPM或更快日勺硬盘；其他外设：麦克风等音频输入设备，耳

19、麦等音频输出设备；软件环境（一）操作系统：MicrosoftWindowsXPMicrosoftWindowsServer2023ServicePack2MiCrOSOftWindowsServer2023（二）运行环境1 .NETFrameWork3.5或更高版本。2 .对的安装微软SDK语音引擎包及微软SDK语音引擎中日语言包。2.5 条件与限制由于本系统为语音识别系统，程序运行时需要接受并分析判断来自终端输入H勺语音音频，因此程序运行时对周围环境的嘈杂程度规定很高，规定周围环境噪音越小越好，最佳是在一种安静的环境里；另首先，在使用我们的产品之前，最佳是做一种语音训练，以便让计算机更熟悉顾

20、客的声音，以便顾客的操作，让顾客使用的更舒心，我们更放心；再次，也规定顾客所使用的音频输入设备（麦克风）的质量要好，也就是要保证语音识别率高。2.6 假设与依赖本项目基于.NET并依赖于微软最新语音识别引擎、SpeechAPI5.1（语音编程接口）。三.大赛项目规定（功能需求）3.1 功能需求简介运用既有语音引擎或独立底层开发基于语音识别技术的Windows操作助手，助手可以协助顾客在任何可以输入文字的地方根据顾客语音命令输入文字，也可以协助顾客使用语音进行WindoWS的常规操作，如启动某某软件，关闭目前窗口，关闭WindoWS,点击特定按钮或选择指定的菜单项，激活某个正在运行日勺软件窗口（

21、虽然得该软件窗口获得焦点），拷贝屏幕区域，上翻或下翻目前正在浏览的网页或阅读的文章，删除文献，清空文献垃圾桶等。助手在协助顾客进行多种操作时要在屏幕上明显体现出该操作是助手协助完毕的，以区别于顾客通过鼠标或键盘进行的其他操作。要保证在不需要助手的时候，它会安静的呆在一边,不能影响顾客的正常操作。赛题中波及时重要技术难点有两个，语音识别及屏幕取词，本产品都已经突破。此语音系统的重要功能是通过语音输入、识别来实现最终的语音控制，其中语音识别子系统中又有语音训练向导、麦克风设置向导、自定义词库、发音敏捷度设置等设置功能；此外,文本朗诵，语音精灵是本系统的辅助功能；对本系统的功能简介我们将在功能概要设

22、计阐明及细节阐明中给出详细的阐明，下面通过一种形象的实例简介系系统所提供的服务。3.2 功能需求实例图3.2功能需求流程图开始用户操作界面Pl.1语音识别功能模块Pl.4语音系统设置/操作模式判定.5字询Pl字杳屏幕取词I功能实现I检出文字列表到界血查询区域系统命令操作处理PL6当前运行程序窗体操作控制系统常川操作命令Pl.7当前运行程序窗体内容操作打开网页类命令操作调用系竣程序用户口定义命令*找命令库文件,执打操作代找命令库文件，执行操作次找命令库文件,执行操作介找命令库文件,执行操作作找命令库文件,执行操作3.2 功能一一一语音识别与输入321功能阐明此功能应当是本系统实现主功能的基础重要

23、功能，优先级高。3.2.2功能描述规定系统可以精确识别顾客通过终端输入的语音，在任何可以输入文字的地方根据顾客语音命令输入文字，并也可以协助顾客使用语音进行IVindOWS的常规操作（波及语音控制）。语音识别是大赛规定中提到的技术难点之一。顾客对着麦克风说话，实现和计算机的互动，实际上是我们的产品接受了顾客说的内容，然后把声音转换为文字，在命令模式下，实现了顾客说什么计算机则会根据顾客所说的命令执行对应的操作。当顾客的命令计算机不存在或顾客说的不精确时，我们的精灵则会提醒顾客没有该命令，或说的命令不精确提醒顾客请再说一遍。在输入模式下，实现了完全取代键盘和鼠标的操作，使顾客不用再运用鼠标和键盘

24、向计算机传播输入的信息文字，在此模式下，顾客说什么，计算机就会“写”什么。同步，输入模式和命令模式可以互相转换。3.3 功能二屏幕取词3.3.1 功能阐明屏幕取词功能同样是实现主控制功能的重要基础功能，是实现语音识别的重要基石之一。其优先级别也较高。3.3.2 功能描述通过此功能可以获得桌面，系统窗体，以及任务栏、选项卡、标签等其内部的任何文本，在命令模式下，根据顾客说出的命令，在打开的窗体中进行“查找”和“匹配”，在模糊匹配的协助下，找到顾客说出的命令然后执行对应的操作。此功能在描述上简朴，不过实现上将是一种难点，屏幕取词同样也是大赛规定中提到的技术难点之二。3.4 功能三一一语音控制3.4

25、.1 功能阐明语音控制功能是本系统的主功能及关键功能，语音控制计算机的各个内部操作。其优先级别最高。3.4.2 功能描述在语音识别，屏幕取词的基础上实现的语音控制最终抵达协助顾客在任何可以输入文字的地方根据顾客语音命令输入文字，并也可以协助顾客使用语音进行WindoWS的常规操作，如启动某某软件，关闭目前窗口，关闭WindoWs,点击特定按钮或选择指定的菜单项，激活某个正在运行的软件窗口（虽然得该软件窗口获得焦点），拷贝屏幕区域，上翻或下翻目前正在浏览的网页或阅读的文章，删除文献，清空文献垃圾桶等等基础操作。同步，基于屏幕取词和模糊匹配的协助下，语音控制实现了更深一层的突破，使顾客想要计算机执

26、行什么操作，只要对我们的产品下命令，应用程序就会“告诉”计算机顾客想干什么，计算机就会执行对应的操作，抵达顾客的需求。该产品就是“顾客”和”计算机”沟通的桥梁，以便他们之间的交流。真正实现了“君子动口不动手”。3.5 功能四一一语音精灵351功能阐明此功能是本系统的辅助功能之一，为我们的产品添加生趣和色彩0优先级别中等。3.5.2功能描述语音小精灵重要提高本系统使用/J趣味性，增长了人机互动，同步语音小助手实时报时，错误提醒等功能提高了实用价值。使顾客在使用我们的产品时能用时满意，用的舒心，我们放心。3.6 功能五一一语音朗诵(TTS)3.61功能阐明此功能是本系统的辅助功能之二，优先级别中等

27、。3.6.2功能描述将文本变成语音进行朗诵，能用不同样的语音来朗诵文木。可以朗诵中文或英文的(,txt)文本。在进行语音朗诵前或朗诵时您可以随时设置【音量大小】和【语音速度】，以保证文本输出的语音音律流畅，使得您在听取信息时感觉自然。此外，本软件还可以将所朗诵的文本保留为音频文献(.wav)o语音朗诵将会协助顾客朗诵文本文献内容，运用的是微软SAPl的语音合成技术及语音引擎将文本转化成语音并输出。在此功能中，您可以选择“男”或“女”来读您载入的文本，也可选择“中文”或“英文”来朗诵。此功能从技术上来说，我们是调用系统中存在的多种语音引擎进行朗诵，主线是调用COm对象(全反射、没有引用COmocx),并且使用引擎保留声音。四.运行规定4.1 顾客界面顾客界面简介、实用，助手形象要有趣、大方、可爱。可以博得顾客爱慕，让顾客用的满意舒心，我们也放心。4.2 硬件接口1 .接口名称：音频输入接口规格阐明：顾客计算机音频输入插口。2 .接口名称：音频输出接口规格阐明：顾客计算机的音频输出接口。3 .3软件接口SAPI（语音接口）接口名称：SAPI（语音接口）规格阐明：文本合成语音应用程序接口，语音识别应用程序接口版本号：5.1版接口名称：win32API（系统编程接口）规格阐明：提供底层系统编程方案。版本号：待定。

展开阅读全文