《机辅翻译2021.docx》由会员分享,可在线阅读,更多相关《机辅翻译2021.docx(9页珍藏版)》请在课桌文档上搜索。
1、CAT计算机辅助翻译TM翻译记忆MT机器翻译TMX翻译记忆交换TBX术语库交换PE译后编辑PDF便携式文档格式OCR光学字符识别BLEU双语评价指标QAQualityAssurance质量保证TEPTranslationEditingProofreading翻译编辑校对XML:extensibleMarkupLanguage扩展标记语言HTML:Hyper-TextMarkupLanguage超文本标记语言XLIFFXMLLocalizationInterchangeFileFormatXML本地化交换文件格式计算机辅助翻译工具的工作原理翻译记忆技术是狭义CAT工具的核心技术,其技术主张是做过
2、的事无需再做。译员工作时,系统在后台建立翻译记忆库(TM),每当原文出现相同或相近词句时,系统会提示用户使用记忆库中最接近的译法,译员可以根据需要采用、舍弃或编辑重复出现的文本。记忆库技术决定了CAT工具主要适用于有重复或重复率较高的科技、新闻、法律、机械、医学等非文学翻译领域,可以帮助译员节省大量时间,避免重复劳动,改进、提高翻译质量。三种典型机器翻译的工作原理基于规则:基于规则的翻译,翻译知识来自人类专家。找人类语言学家来写规则,这一个词翻译成另外一个词。这个成分翻译成另外一个成分,在句子中的出现在什么位置,都用规则表示出来。这种方法的优点是直接用语言学专家知识,准确率非常高。缺点是什么呢
3、?它的成本很高,比如说要开发中文和英文的翻译系统,需要找同时会中文和英文的语言学家。要开发另外一种语言的翻译系统,就要再找懂另夕一种语言的语言学家。因此,基于规则的系统开发周期很长,成本很高。此外,还面临规则冲突的问题。随着规则数量的增多,规则之间互相制约和影响。有时为了解决一个问题而写的一个规则,可能会引起其他句子的翻译,带来一系列问题。而为了解决这一系列问题,不得不引入更多的规则,形成恶性循环。基于统计:统计机器翻译系统对机器翻译进行了一个数学建模。可以在大数据的基础上进行训练。它的成本是非常低的,因为这个方法是语言无关的。一旦这个模型建立起来以后,对所有的语言都可以适用。统计机器翻译是一
4、种基于语料库的方法,所以如果是在数据量比较少的情况下,就会面临一个数据稀疏的问题。同时,也面临另外一个问题,其翻译知识来自大数据的自动训练,那么如何加入专家知识?这也是目前机器翻译方法所面临的一个比较大挑战。基于神经网络:神经网络翻译近年来迅速崛起。相比统计机器翻译而言,神经网络翻译从模型上来说相对简单,它主要包含两个部分,一个是编码器,一个是解码器。编码器是把源语言经过一系列的神经网络的变换之后,表示成一个高维的向量。解码器负责把这个高维向量再重新解码(翻译)成目标语言。当前机器翻译系统存在的缺点词汇错误包括:术语错译、连词错译、词性错译、词汇缩写错译、词汇漏译、词汇替代错译、词汇不译;句法
5、错误包括:词序错译、名词短语错译、动词短语错译、介词短语错译、被动语态错译、动词不定式错译、分词错译。计算机辅助翻译与机器翻译的区别一、性质不同1、计算机辅助翻译(CAT)类似于CAD(计算机辅助设计),能够帮助翻译者优质、高效、轻松地完成翻译工作。它不同于以往的机器翻译软件,不依赖于计算机的自动翻译,而是在人的参与下完成整个翻译过程。2、机器翻译,又称为自动翻译,是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程。二、翻译过程的主导者不同1、计算机辅助翻译必须依靠人工译员,再辅以各类计算机化工具开展。这些辅助工具主要用于流程管理、术语建库、语料建库、知识库管理等。2、
6、机器翻译完全依赖于计算机。理解机器翻译与人工翻译之间的关系译后编辑的两种类型特征及应用场景快速/简单译后编辑:如果翻译内容用于出版,则需要近似人工翻译的质量。仅修改严重的,明显的错误,允许小问题的存在准确性至关重要避免文体和偏好性的改动快速处理风格,标点符号和拼写可以变化全面译后编辑:如果翻译内容只是用于内部使用或仅作参考用途,进行简单或快速的译后编辑以消除明显错误就足够了。错误修改要详尽,不应忽略语法或拼写错误。接近人工翻译质量术语精确修改所有误译风格适当且统一列出8种典型的计算机辅助翻译工具及厂家TradosMemoqPassoloTransitAcrossWordfastWorkspac
7、eMemsource列出8种典型的机器翻译工具名称DeepL百度翻译有道翻译谷歌翻译必应翻译搜狗翻译腾讯翻译CNKl翻译翻译记忆库与翻译术语库的区别翻译记忆库和术语库是在我们在用Trados进行翻译时的两大重要辅助工具。用最通俗的话讲,翻译记忆库储存的是英汉(当然也可以是其它语言)对照的句子,术语库储存的则是英汉对照的单词或词组。在翻译过程中我们可以通过模糊搜索,获取这两个库里的数据,给自己提供参考。翻译记忆库是一种翻译工具,用于记忆和协助翻译内容,而翻译术语库则是翻译人员如何翻译翻译项目的特定术语的指南。通过为关键术语提供明确定义的翻译,翻译术语库可以节省时间,降低成本,提高质量并保持所有翻
8、译和本地化项目的一致性。翻译记忆库保持一致的术语并自动翻译重复性文本,既节省时间又节省金钱,同时提高整体质量。PDF文件的类型,转换成DOCX格式的常用工具ABBYYPDFTranSformer+有三种不同类型的PDF文档。仅包含页面图像的文档不可搜索,其包含的文本也不可编辑。包含文本层的文档可以搜索,包含在这些文档中的文本也可进行复制。那么ABBYYPDFTranSformer+中的这三种PDF文档都各有什么特点呢?我们该如何仔细的区分它们。常规PDF文档当将可编辑格式的文档转换为PDF格式时,就会创建常规PDF文档。其中包含文本层和插图。此类PDF文件的大小比较小,它们是可搜索的。可选择、
9、删除或修改它们的文本,如其他可编辑的格式一样(如MicrosoftWord可搜索的PDF文档可搜索的PDF文档由底下带有文本层的页面图像组成。此类PDF文件几乎与原始文件一样,可完全进行搜索。可选择、复制或标记可搜索的PDF文档中的文本,但不能修改。仅图像PDF文档仅图像PDF文档从硬拷贝文档的扫描中进行创建。它们仅包含页面图像,不带文本层。仅图像PDF文件不可搜索,其包含的文本通常不能进行修改或标记。但是,通过ABBYYPDFTransformer+,您可从此类文档中复制文本,或添加文本层,从而将其转换为可搜索的PDF文档。SDLTradosStudio有哪些功能?接受任何项目,能处理所有文
10、件类型凭借高端技术提高翻译效率改善审校体验定制工作环境可提高效率SDLMuItiTerm有哪些功能?添加删除术语管理术语导入术语编辑术语合并术语查看统计术语管理术语库保证术语一致性对术语进行检索SDLTradosStudio的主翻译记忆库与项目翻译记忆库的区别项目翻译记忆库,是基于某一个项目特定的记忆库,具有显著的独特性和唯一性。主翻译记忆库则可以基于多个项目共同使用,具有通用性。设定项目翻译记忆库进行翻译,可以将翻译内容实时更新到项目记忆库,以防止主记忆库受到污染。在确定项目翻译记忆库正确无误之后,可以将项目翻译记忆库内容更新到主翻译记忆库,实现语料的回收整理。SDLTradosStudio
11、M预翻译是什么含义和作用?尤其是利用翻译记忆库将待翻译文件进行批量预翻译处理,是很多资深译员的选择。预翻译能将达到匹配率的记忆库文本自动填充到译文栏中,而译者只需要在已有文本的基础上进行调整即可。这既能减少译员逐句查询的时间,又能保证文本中定义、专业术语和文体风格的一致性。对于高匹配值的文本,预翻译功能效果显著。可如果译员手中暂时没有可用的记忆库,翻译任务量却又多又急,这时利用机器翻译就成了一种比较好的替代方案。译员可以先用机器翻译得到一个比较粗略的翻译结果,并在此基础上进行译后编辑。简要解释TM+MT+PE+QA翻译模式的含义TM翻译记忆MT机器翻译PE译后编辑QAQualityAssura
12、nce质量保证【融合TMMT+TB的ACAT方式】(1)神经机器翻译NMT技术问世以来,译文质量不断提高,机器翻译+译后编辑成为现实。但是如何利用此前翻译获得的翻译记忆语料库和术语库,发挥译者创造性,于是出现了翻译记忆库预翻译TM+机器翻译MT+译后编辑PE+术语库TB+质量保证QA的人机融合增强计算机辅助翻译方式(ACAT)。(2)传统CAT软件增强了机器翻译的调用接口,新一代机器翻译软件增加了用户翻译记忆库接,二者不断融合。(3)随着5G通讯技术的应用,以影视、游戏为代表的视频材料翻译需求增加,各类计算机辅助翻译软件支持可视化视频增强计算机辅助翻译,SDLTradosStUdiC)和memoQ都看到了这个趋势。